豆包语音识别2.0升级:新增13国外语,听得懂文字看得懂图
12月5日消息,火山引擎今日发布了豆包语音识别模型2.0(Doubao-Seed-ASR-2.0),该模型基于Seed混合专家大语言模型架构构建。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
据悉,2.0版本模型在推理能力方面显著提升,通过深度理解上下文情境实现精准识别,上下文整体关键词召回率提升了20%。
同时该模型支持多模态视觉识别,不仅能够"听懂文字",还能"看懂图片",借助单图和多图等视觉信息输入,使文字识别更精准。

此外,2.0版本还支持日语、韩语、德语、法语等13种外语的精准识别。

新版本重点针对专有名词、人名、地名、品牌名称及易混淆多音字等复杂场景进行了升级优化。
以历史人物生平讨论场景为例,当用户提到苏轼谦称"筠(yún)州"时,若模型缺乏推理能力容易将其误识为同音的"云州""郓州"等。
而豆包语音识别模型2.0可依托"当前讨论苏轼、苏辙"这一背景,即使上下文中从未出现过"筠州",也能通过逻辑推理锁定用户所指的特定地名,最终实现对多音字地名的精准识别。

目前,豆包语音识别模型2.0已上线火山方舟体验中心,并对外提供API服务。

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
3nm产能紧缺,台积电核心客户优先供货策略解析
3月29日消息,据DigiTimes报道,台积电3nm制程产能已处于高度紧张状态,多家企业的产品推进计划因拿不到足够的产能而被迫调整。在AI竞赛全面升温的背景下,台积电的制造能力正成为整个行业最大的
防黄牛新规:名创优品未注册会员无法结账引热议
3月29日消息,据媒体报道,不少网友近日发帖称,在名创优品购买产品被店员告知需要先注册成为会员,否则无法结账,引发网友争议。有网友表示,只有购买盲盒才需要出示会员码。但也有部分网友称,购买其他日用品
莫言线上种地互动受热捧:年轻人乐把网络“爷爷”挂心头
3月29日消息,今日,2026中国网络媒体论坛在郑州开幕,当莫言走上讲台时,他的一句开场白便让全场会心一笑。“接到邀请时很吃惊,怎么会找我这样一个老头子呢?他们说你是网红。我什么时候不小心成了网红了
深圳车牌竞价十连降:铁皮不香了,价格跌破2万大关
3月29日消息,2026年第3期深圳普通小汽车增量指标竞价结果显示,个人指标最低成交价仅1 64万元,这也是该价格连续10期跌破2万元大关。与之形成对比的是,本期个人车牌摇号中签率依旧低迷,超104
周鸿祎中关村论道:智能体重塑产业格局,6大方向驱动变革
在日前举办的2026中关村论坛年会全球独角兽企业大会上,360集团创始人周鸿祎发表主题演讲,围绕以“龙虾”(OpenClaw)为代表的新一代智能体技术,系统阐述了人工智能加速演进所带来的产业变
- 日榜
- 周榜
- 月榜
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程

