豆包发布4款大模型:语音合成/声音复刻,支持情感与风格调节

10月16日,据“火山引擎”官方公众号消息,在今日举行的FORCE LINK AI创新巡展·武汉站活动中,火山引擎正式发布并升级了四款豆包大模型:豆包大模型1.6升级版,原生支持4种思考长度;豆包大模型1.6 lite、豆包语音合成模型2.0、豆包声音复刻模型2.0全新亮相。
各款模型的核心信息汇总如下:
豆包大模型1.6升级版
此次升级提供了Minimal、Low、Medium、High四种思考长度配置,帮助企业根据实际应用场景在模型效果、响应速度和成本控制之间找到最佳平衡点,同时显著提升了模型的思考效率。值得一提的是,这也是国内首个原生支持“分档调节思考长度”功能的大模型。
与升级前采用的单一思考模式相比,升级后的豆包1.6模型在保持模型效果不变的前提下,实现了总输出Tokens数量降低77.5%、思考时间缩减84.6%的显著提升。
为了进一步满足企业多样化的需求,火山引擎同步推出了豆包大模型1.6 lite(Doubao-Seed-1.6-lite)。相比旗舰版豆包1.6,这款轻量版模型体积更小、推理速度更快,同时具备更优的性价比。在效果方面,该模型已全面超越豆包大模型1.5 pro(Doubao-Seed-1.5-pro),在企业级场景测评中较豆包1.5 pro提升14%;在价格方面,在使用量最大的0-32k输入区间内,综合使用成本较豆包1.5 pro降低53.3%。
豆包语音合成、声音复刻2.0模型
豆包语音合成模型2.0(Doubao-Seed-TTS 2.0)与豆包声音复刻模型2.0(Doubao-Seed-ICL 2.0)在情感表现力、指令遵循能力和复杂公式朗读准确性方面都实现了显著提升。
基于豆包大语言模型研发的全新语音合成架构,让合成与复刻的声音都具备深层次的语义理解能力,并拓展出上下文推理功能,从单纯的文本朗读进化成为“理解后的精准情感表达”。用户还能通过自然语言指令,实现对语速、情绪、声线、音调和风格变化的精细调控,大幅提升了语音生成的可控性。
新发布的两大语音模型还针对教育场景进行了专项优化。目前,在小学至高中阶段全学科的复杂公式朗读测试中,准确率可达90%。
免责声明
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
三七互娱ESG实践剖析:创新融合开拓可持续新路径
在互联网文娱领域,三七互娱凭借其在ESG(环境、社会和公司治理)领域的卓越实践,成为行业标杆。作为国内首家获得明晟MSCI ESG评级AA级并连续三年保持该评级的游戏企业,三七互娱不仅在国内ESG指
荣耀Magic8概念机亮相:Robot Phone将于2026年MWC发布
荣耀在北京水立方举办新品发布会,正式推出新一代旗舰机型荣耀Magic8系列及全新MagicOS 10操作系统。此次发布的Magic8系列被定义为全球首款 "自进化AI原生手机 ",同时亮相的AI概念手机
文心助手升级:8大模态创作矩阵+实时数字人引领AI交互
百度搜索近日宣布,旗下文心助手AIGC创作能力迎来重大升级,推出覆盖AI图片、视频、音乐、播客等8大模态的创作矩阵,并同步发布行业首个开放式实时互动数字人智能体。此次升级标志着搜索引擎从传统信息检索
2025最佳发明盘点:300项创意是创新盛筵还是过度包装?
近日,《时代》杂志公布了其评选的2025年度最佳发明榜单,这份包含300项发明的名单引发了广泛讨论。自2000年首次评选以来,该榜单的规模逐年扩大,从最初的35项增至如今的300项,甚至额外增加了1
阿里巴巴加码具身智能,全面布局赛道人形大脑落地
具身智能领域迎来重要融资动态,上海穹彻智能科技有限公司宣布完成新一轮战略融资,由阿里巴巴集团领投,同时获得多家老股东的持续跟投。本轮资金将重点投入技术研发、场景落地及生态体系建设,进一步巩固其在具身
相关攻略
热门教程
更多- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程



















