首页
科技
OpenAI推出小型语音模型,强调语音交互在未来人机沟通中的核心地位【附多模态大模型行业市场分析】

OpenAI推出小型语音模型,强调语音交互在未来人机沟通中的核心地位【附多模态大模型行业市场分析】

热心网友
转载
2025-10-08
来源:https://t.qianzhan.com/caijing/detail/251007-6f74f728.html

2025年10月7日,OpenAI首席执行官萨姆·奥尔特曼(Sam Altman)在开发者日活动上宣布,正式通过API推出新一代语言模型GPT-5 Pro及轻量化语音模型“GPT-realtime-mini”,旨在进一步降低开发者集成语音功能的门槛,推动多模态人机交互的普及。

奥尔特曼特别强调了语音交互在未来人机沟通中的核心地位。他指出,随着技术发展,语音将成为用户与AI系统交互的主要方式之一。此次推出的轻量化语音模型,正是为了降低开发者集成语音功能的门槛,推动语音交互技术在更多场景中的普及应用。

此次发布与GPT-5 Pro模型同步推出,后者专注于金融、法律、医疗等高精度推理场景,支持40万tokens上下文长度,但仅通过Responses API提供。同时,OpenAI还发布了视频生成模型Sora 2的API预览版,并上线了AgentKit智能体开发工具,进一步丰富开发者生态。

面对全球AI厂商在API生态领域的竞争,OpenAI通过轻量化模型和降价策略吸引开发者。业内分析指出,API标准化或成为行业下一步焦点,有望降低开发门槛并提升模型互操作性。随着语音交互在智能家居、车载系统等场景的普及,OpenAI此举可能重塑多模态AI市场的竞争格局。

多模态大型语言模型(Multimodal Large Language Models,简称MLLMs)是一类结合了大型语言模型(Large Language Models,简称LLMs)的自然语言处理能力与对其他模态(如视觉、音频等)数据的理解与生成能力的模型。这些模型通过整合文本、图像、声音等多种类型的输入和输出,提供更加丰富和自然的交互体验。

图表1:多模态大模型的分类

多模态大模型产业链是一个庞大而复杂的系统,涵盖了从硬件设施到软件开发的各个环节,主要包括基础层、模型层和应用层。其中,基础层主要包括硬件和基础软件,模型层主要是多模态大模型的种类,包括CLIP、BLIP、BLIP-2、dreamLLM、LLaMA、LLaVA、flamingo、mini-GPT4等,应用层则是指大模型结合行业的进一步升级应用形成的行业大模型,主要包括生产制造领域、生活娱乐领域和公共服务领域等。

图表2:中国多模态大模型产业链

早期大模型的商业模式主要为SaaS模式和PaaS模式,但随着大模型行业的快速发展以及再各行各业的快速拓展应用,以大模型为核心的MaaS模式(模型即服务)出现,MaaS模式允许大模型服务提供商将大模型的特定功能或整个模型封装为API(应用程序接口),并将其作为一种服务,提供给其他开发者或业务合作伙伴使用,是目前大模型行业一种主流的商业模式。

图表9:多模态大模型行业的商业模式

业内分析认为,OpenAI此次双管齐下的产品策略,既保持了其在文本生成领域的领先优势,又通过专用语音模型完善了多模态交互能力。这种技术布局不仅满足了市场对高效AI工具的需求,也为构建更自然的人机交互体验奠定了基础。

前瞻经济学人APP 产业观察组

免责声明

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章

电动车电池总“吃撑”?别总满电存放,老司机都在这个充电区间“宠”电池

“您家电池是不是经常满电放在楼下?”前不久,帮母亲更换电动车电池时,修车师傅的一句话让我愣住了。他轻敲着新换的电池外壳解释:“长期满电暴晒,再好的电池也撑不过一年。”这句话彻底颠覆了我对电动车电池的

2025-10-08.

众泰汽车债权人3060万购子公司闲置资产,助力公司盘活资产解债务

众泰汽车近日宣布,已与深圳立迅实业达成一项债务重组协议。根据协议内容,立迅实业将以3060万元(含税)的价格,收购众泰汽车全资子公司深康车身的部分闲置生产线及相关设备等固定资产。 此次交易中,众泰汽

2025-10-08.

廉价版Model Y降价还“增配”?配置明细曝光,或搅动20多万新能源市场

近日,海外媒体透露了特斯拉即将推出廉价版Model Y的消息,其价格预计比现款车型降低约10%。根据这一比例推算,国内市场的廉价版Model Y售价或将在23万元区间,这一价格调整引发了市场的广泛关

2025-10-08.

诺奖得主山中露营“失联”:下山获知喜讯,与同奖者共话惊喜未来

2025年诺贝尔生理学或医学奖得主弗雷德·拉姆斯德尔在获奖后,向媒体分享了他得知这一喜讯的奇妙经历。这位科学家与妻子当时正在黄石国家公园附近的深山露营,突如其来的暴雪切断了他们与外界的联系,手机信号

2025-10-08.

吉利放大招!11.88万起享沃尔沃2.0T+8AT,智驾加持能否搅动A级车市场?

近日,汽车圈被吉利一款新车搅得热闹非凡。这款车竟搭载了与沃尔沃同源的2 0T发动机,还配备了爱信8AT变速箱,起售价却仅为11 88万元,甚至还拥有智能驾驶功能,如此配置在A级车市场无疑是一颗重磅炸

2025-10-08.

热门教程

更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程

最新下载

更多
梦的第七章
梦的第七章 卡牌桌游 2025-10-08更新
查看
梦的第七章手游
梦的第七章手游 角色扮演 2025-10-08更新
查看
我爱拼模型国际服
我爱拼模型国际服 休闲益智 2025-10-07更新
查看
疯狂射击
疯狂射击 飞行射击 2025-10-07更新
查看
我爱拼模型
我爱拼模型 休闲益智 2025-10-07更新
查看
精灵序曲手游
精灵序曲手游 棋牌策略 2025-10-08更新
查看
精灵序曲
精灵序曲 角色扮演 2025-10-08更新
查看
定制坦克
定制坦克 飞行射击 2025-10-07更新
查看
梦想桃源手游
梦想桃源手游 棋牌策略 2025-10-08更新
查看
精灵序曲九游
精灵序曲九游 棋牌策略 2025-10-08更新
查看