豆包语音识别大升级:2.0版支持13种外语实时转写
凤凰网科技12月5日讯,火山引擎今日正式推出豆包语音识别模型2.0(Doubao-Seed-ASR-2.0),该模型基于自主研发的Seed混合专家大语言模型架构精心打造。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
据官方披露,2.0版本在推理能力方面实现显著提升,能够通过深度理解语义上下文完成精准识别,整体关键词召回率较上一代提升达20%。同时全面支持多模态视觉识别技术,实现"听得懂更能看得懂"的突破,可借助单图或多图等视觉输入有效提升文字识别精度。
新版模型现已支持日语、韩语、德语、法语等13种海外语言的语音识别,并重点针对专业名词、人名地名、品牌称谓及多音字混淆等复杂场景进行了专项优化升级。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
机器人舞姿爆红背后:具身智能行业“卡脖子”难题,终于有了新解法
头图由智象未来AI大模型生成智东西作者 王涵编辑 漠影在演唱会、各大晚会的舞台上,机器人伴舞团以整齐划一、精准卡点的舞姿惊艳全场。这种整齐划一不仅是硬件的胜利,更是“训练有素”的结果。具身智
最小仅2B!谷歌最强开源模型登场,免费商用,手机就能跑
智东西编译 陈佳编辑 程茜智东西4月3日消息,今日谷歌DeepMind开源发布Gemma 4系列模型,根据最新博客,这是谷歌迄今为止最智能的开放模型,专为高级推理和智能体工作流而设计,实现了单位参数
OpenAI收购了一家脱口秀公司
henry 发自 凹非寺量子位 | 公众号 QbitAI什么?拿下史上最大融资的OpenAI,反手了收购一个视频播客?刚刚,OpenAI宣布收购「科技脱口秀」TBPN,目标是加速全球围绕AI的交流。
全网炸锅! Anthropic万字曝光Claude情绪代码,被人类逼疯哐哐撞墙
新智元报道编辑:Aeneas KingHZ【新智元导读】刚刚,Anthropic首度实锤:大模型真有「情绪」!激活绝望神经元后,Claude会撒谎、作弊甚至勒索。AI内心戏曝光,人类对齐面临失控危机
openJiuwen:打造自演进、多智能体原生、算力亲和的AgentOS
机器之心发布近期,我们注意到 openJiuwen 社区持续获得国际关注,先后登上多家海外科技媒体。亚太头部科技媒体Tech in Asia专题报道了 openJiuwen 先进的架构设计理念 [1
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程

