当前位置: 首页
业界动态
火山引擎发布豆包大模型1.8,多模态Agent能力全球领先

火山引擎发布豆包大模型1.8,多模态Agent能力全球领先

热心网友 时间:2025-12-18
转载

12月18日,火山引擎在FORCE原动力大会上正式发布了豆包大模型1.8及音视频创作模型Seedance 1.5 pro。多项权威测评数据显示,豆包大模型在多模态理解、生成能力及Agent能力上,均已跻身全球第一梯队。

据火山引擎总裁谭待介绍,截至今年12月,豆包大模型日均token使用量已突破50万亿,较去年同期增长超过10倍;目前已有超过100家企业客户累计token使用量超过一万亿。

火山引擎发布豆包大模型 1.8,多模态 Agent 能力进入全球第一梯队

▲ 图:火山引擎总裁谭待

豆包大模型 1.8:打造更强大的多模态Agent“大脑”

作为豆包家族的最新旗舰模型,豆包大模型 1.8(Doubao-Seed-1.8)专门针对多模态Agent场景进行了深度优化。其工具调用能力、复杂指令遵循能力及操作系统级Agent能力均实现显著提升,增强了模型在处理复杂任务时的规划与执行水平。

在视觉理解方面,豆包 1.8 的单次视频理解帧数从640帧倍增至1280帧。模型支持以低帧率高效理解超长视频,并能自动调用工具对关键片段进行高帧率精准分析。这项能力可广泛应用于在线教育、产品质检、安防监控等多种业务场景。

火山引擎发布豆包大模型 1.8,多模态 Agent 能力进入全球第一梯队

火山引擎发布豆包大模型 1.8,多模态 Agent 能力进入全球第一梯队

图:豆包大模型 1.8 测试表现

在多项公开测评中,豆包 1.8 展现出极具竞争力的全面表现:在视觉推理、通用视觉问答、空间理解及视频理解等任务中,均获得最佳或接近最佳成绩;在通用智能体测评集BrowserComp上表现全球领先;在数学与推理等基础能力维度上,整体水平已接近全球顶尖的通用模型。

Seedance 1.5 pro:音画精准同步,重塑AI视频生产力

为应对日益增长的视频内容创作需求,火山引擎推出了Seedance 1.5 pro音视频创作模型。该模型不仅具备影视级的叙事张力,能够精确捕捉运动细节并细腻呈现人物情绪,更在音画同步技术上取得了突破性进展。

Seedance 1.5 pro采用了创新的原生音视频联合生成架构,支持环境音、背景音乐、人声口型等多种元素的独立控制与融合,实现了毫秒级的音画同步输出。在对白处理上,模型支持多人多语言对话,口型与发音精准对齐,覆盖中文方言(如四川话、粤语等)、英文及多种小语种,极大地提升了视频内容的真实感与全球化创作潜力。

为进一步降低创作门槛与成本,Seedance系列即将上线“Draft样片”功能。创作者可先生成低分辨率样片进行预览,其核心构图、运镜、人物动作等关键元素与最终成片高度一致,真正做到“预览即所得”。数据显示,该功能可帮助创作者提升65%的整体创作效率,并减少60%的无效试错成本。

目前,个人用户已在豆包、即梦AI等App体验该模型;企业用户则从12月23日起,可通过火山引擎API接入Seedance 1.5 pro模型服务。

升级AI云原生架构,构建Agent规模化落地底座

谭待指出,传统的IT架构已无法满足Agent时代的需求,以模型为中心的AI云原生架构正在形成,并围绕Agent的开发与运营进行深度重构。

在Agent开发层面,火山引擎全面升级了企业级AI Agent平台——AgentKit。该平台覆盖了Agent从开发、部署到管控的全生命周期,旨在解决企业在Agent落地中面临的身份权限管理、模型调用确定性及系统集成等核心挑战。

在Agent运营层面,火山引擎推出了HiAgent智能体工作站。该工作站通过构建统一的企业AI任务调度中心、提供一系列开箱即用的通用智能体,以及支持个性化定制智能体应用,帮助企业实现Agent的规模化管理与高效应用,降低运营复杂度。

此外,为降低企业使用门槛,火山引擎推出了业内首个“AI节省计划”。该计划覆盖所有按量付费的大模型产品,通过阶梯式用量折扣,可帮助企业最高节省47%的模型调用成本。

谭待表示,通过对从模型能力到基础设施的全面革新,火山引擎正在推动AI应用从单一的模型调用向复杂的Agent智能体生态系统演进,加速AI能力在各行各业的深度融合与落地。

来源:https://www.ithome.com/0/905/968.htm

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
TypeScript 7.0 Beta 新特性发布与升级指南

TypeScript 7.0 Beta 新特性发布与升级指南

TypeScript 7 0 Beta 的发布,其意义远超引入几个新语法特性。真正的变革发生在底层——编译器核心从 TypeScript JavaScript 迁移到了 Go 语言。这标志着 TypeScript 正式迈入原生性能、多线程并发与现代工程架构的新阶段。对于小型项目,你可能只会感觉“编译

时间:2026-05-19 18:33
2026年学习机选购指南AI智能辅导与作业批改五大高效机型推荐

2026年学习机选购指南AI智能辅导与作业批改五大高效机型推荐

近年来,AI学习机市场经历了从“电子书”到“网课平板”的快速演变。进入2026年,竞争已进入深水区,真正比拼的是产品的“AI内功”。家长们的选购标准也愈发清晰:是否配备了能真正讲课的AI老师?辅导功能是否足够智能精准?能否一站式完成作业批改与讲解?这三大核心能力,已成为衡量一款AI学习机是否合格的关

时间:2026-05-19 18:33
海能达亮相CCA 2026以AI赋能关键通信携手伙伴探索智能路径

海能达亮相CCA 2026以AI赋能关键通信携手伙伴探索智能路径

4月底,香港迎来全球专用通信行业盛会——Critical Communications World Asia 2026(CCA 2026)。作为全球关键通信领域的领军企业,海能达不仅展示了其旗舰终端与前沿行业解决方案,更深入分享了在人工智能时代下,关键通信智能化发展的核心洞察与未来路径。展会现场思想

时间:2026-05-19 18:33
2026年笔记本电脑选购指南 5070显卡机型推荐

2026年笔记本电脑选购指南 5070显卡机型推荐

对于追求高性能的主流游戏玩家和内容创作者而言,搭载RTX 5070显卡的笔记本电脑无疑是当前市场的“甜点级”选择。它凭借4608个CUDA核心与8GB GDDR7显存的均衡配置,在畅玩3A大作与高效生产力应用之间找到了绝佳平衡点。目前,8000元价位段竞争激烈,各大品牌纷纷推出高性价比机型,各有侧重

时间:2026-05-19 18:01
2026北京车展首发中国首款原生Robotaxi 2027年量产上市

2026北京车展首发中国首款原生Robotaxi 2027年量产上市

在2026北京国际汽车展览会上,一款定义未来出行的标杆车型正式全球首发——中国首款正向研发的原生Robotaxi Eva Cab。它的亮相不仅是一款新车的发布,更标志着中国自动驾驶出行服务正式迈入规模化、商业化运营的全新阶段。 Eva Cab的成功并非源于简单的技术叠加,而是产业生态深度融合的典范。

时间:2026-05-19 18:00
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程