豆包语音识别模型2.0发布:支持多模态视觉识别与13种外语
12月5日,火山引擎正式推出豆包语音识别模型2.0(Doubao-Seed-ASR-2.0),该模型基于Seed混合专家大语言模型架构构建而成。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
据最新介绍,2.0版本模型的推理能力显著提升,能够通过深度理解上下文语境实现精准识别,其整体关键词召回率提升了20%。模型支持多模态视觉识别,在“听得懂”的同时也能“看得懂”,可通过单图或多图等视觉信息输入,有效提升文字识别的准确度。
该模型支持日语、韩语、德语、法语等13种海外语种的识别。同时,重点针对专有名词、人名、地名、品牌名称以及易混淆多音字等复杂场景进行了专项优化升级。

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
王兴与具身智能:揭秘陌生任务80-90%完成率的突破
快科技3月29日消息,今日,宇树科技创始人、CEO王兴兴亮相2026中国网络媒体论坛,以《当机器人刷屏》为题发表演讲。现场他提到具身智能还没有到临界点,并个人定义了具身智能的 "GPT时刻 "。带一台机
广汽丰田铂智7订单破万,预售15.68万起亮点解析
IT之家 3 月 29 日消息,在今天的广汽丰田铂智 7 上市发布会上,最新宣布铂智 7 预售订单已超 1 万台。该车于 3 月 5 日开启预售,主打鸿蒙座舱、Momenta 智驾和小米车载生态。广
曾轰动一时的全球现象,为何仅用两年就衰退了?
3月24日,人工智能领域迎来了一次沉重的转折。美国开放人工智能研究中心(OpenAI)在社交媒体上正式发布公告,宣布关停旗下人工智能视频生成工具Sora,这款明星产品,在历经两年的高光与挣扎后,正
宇树科技上海首店:5月底开业,体验人工智能体新浪潮
IT之家 3 月 29 日消息,据“上海静安”公众号今日发文,宇树科技具身智能体验馆亚洲首店,将于 5 月底落地上海市静安区南京西路商圈的久光百货,门店面积超 100 平方米,将展出品牌全线最新产品
国内首个换电系统互操作标准详解与应用前景
(福建日报见习记者 吴函晓 通讯员 雷飏) 日前,由宁德时代主办、时代电服承办的换电标准创新联合体2026年度会议暨标准成果发布仪式在厦门举行,现场发布了国内首个换电互换标准——《纯电动乘用车螺栓式
- 日榜
- 周榜
- 月榜
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程

