当前位置: 首页
AI
豆包语音识别大升级:2.0版支持13种外语实时转写

豆包语音识别大升级:2.0版支持13种外语实时转写

热心网友 时间:2025-12-06
转载

凤凰网科技12月5日讯,火山引擎今日正式推出豆包语音识别模型2.0(Doubao-Seed-ASR-2.0),该模型基于自主研发的Seed混合专家大语言模型架构精心打造。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

据官方披露,2.0版本在推理能力方面实现显著提升,能够通过深度理解语义上下文完成精准识别,整体关键词召回率较上一代提升达20%。同时全面支持多模态视觉识别技术,实现"听得懂更能看得懂"的突破,可借助单图或多图等视觉输入有效提升文字识别精度。

新版模型现已支持日语、韩语、德语、法语等13种海外语言的语音识别,并重点针对专业名词、人名地名、品牌称谓及多音字混淆等复杂场景进行了专项优化升级。

来源:https://www.itbear.com.cn/html/2025-12/1041847.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
机器人舞姿爆红背后:具身智能行业“卡脖子”难题,终于有了新解法

机器人舞姿爆红背后:具身智能行业“卡脖子”难题,终于有了新解法

头图由智象未来AI大模型生成智东西作者 王涵编辑 漠影在演唱会、各大晚会的舞台上,机器人伴舞团以整齐划一、精准卡点的舞姿惊艳全场。这种整齐划一不仅是硬件的胜利,更是“训练有素”的结果。具身智

时间:2026-04-07 11:55
最小仅2B!谷歌最强开源模型登场,免费商用,手机就能跑

最小仅2B!谷歌最强开源模型登场,免费商用,手机就能跑

智东西编译 陈佳编辑 程茜智东西4月3日消息,今日谷歌DeepMind开源发布Gemma 4系列模型,根据最新博客,这是谷歌迄今为止最智能的开放模型,专为高级推理和智能体工作流而设计,实现了单位参数

时间:2026-04-07 11:49
OpenAI收购了一家脱口秀公司

OpenAI收购了一家脱口秀公司

henry 发自 凹非寺量子位 | 公众号 QbitAI什么?拿下史上最大融资的OpenAI,反手了收购一个视频播客?刚刚,OpenAI宣布收购「科技脱口秀」TBPN,目标是加速全球围绕AI的交流。

时间:2026-04-07 11:43
全网炸锅! Anthropic万字曝光Claude情绪代码,被人类逼疯哐哐撞墙

全网炸锅! Anthropic万字曝光Claude情绪代码,被人类逼疯哐哐撞墙

新智元报道编辑:Aeneas KingHZ【新智元导读】刚刚,Anthropic首度实锤:大模型真有「情绪」!激活绝望神经元后,Claude会撒谎、作弊甚至勒索。AI内心戏曝光,人类对齐面临失控危机

时间:2026-04-07 11:37
openJiuwen:打造自演进、多智能体原生、算力亲和的AgentOS

openJiuwen:打造自演进、多智能体原生、算力亲和的AgentOS

机器之心发布近期,我们注意到 openJiuwen 社区持续获得国际关注,先后登上多家海外科技媒体。亚太头部科技媒体Tech in Asia专题报道了 openJiuwen 先进的架构设计理念 [1

时间:2026-04-07 11:31
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程