OpenAI专注研发音频AI模型,加速首款硬件筹备
据IT之家1月1日消息,The Information于北京时间今天晚间报道,OpenAI正在全面强化其音频人工智能(AI)能力,旨在为未来推出一款以语音为核心的个人AI设备进行铺路。多名知情人士透露,这款设备将以听觉交互为主要形式,而非依赖屏幕。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

目前,ChatGPT的语音功能与其文本问答背后所使用的模型并不相同。OpenAI内部研究人员认为,现有音频模型在准确性和响应速度上明显落后,促使公司在过去两个月内整合工程、产品和研究力量,集中攻克音频模型短板。
这一调整直接指向OpenAI的硬件目标——打造一款可通过自然语音指令进行操作的消费级设备。此前报道称,首款产品至少还需要一年时间才能面世。
随着新架构的引入,音频模型已能生成更自然、更富情感的语气回应,并且具备与人类同时发声、应对打断的能力。OpenAI计划在2026年第一季度正式发布该模型。
在硬件形态上,OpenAI的判断与谷歌、亚马逊、Meta和苹果的看法相似:现有主流设备并非为未来的AI交互而生。OpenAI团队希望用户通过“说话”而非“看屏幕”与设备互动,认为语音才是最贴近人类交流本能的方式。
与OpenAI合作推进硬件项目的乔尼·艾维也强调,无屏幕设计不仅更自然,还有助于避免用户沉迷。他认为,新一代设备应当纠正以往消费电子产品带来的负面影响,并为此承担责任。
不过,OpenAI目前仍面临现实挑战。内部人士指出,不少ChatGPT用户并未习惯使用语音功能,这种情况不仅因为音频模型效果不彰,也与功能认知不足有关。在推出音频优先的AI设备之前,OpenAI必须先改变用户的使用习惯。
在组织层面,OpenAI已组建专门团队推进音频AI战略。来自Character.AI的语言研究员昆丹·库马尔负责整体方向,本·纽豪斯正在重构面向音频的底层架构,多模态ChatGPT的产品经理杰基·香农也参与其中。
OpenAI并不打算只推出一款设备,而是规划了一条产品线,包括智能眼镜和无屏幕智能音箱。公司内部的设想是,这类设备将以“伴随式助手”的形态存在,主动理解环境和用户需求,并在获得授权的情况下,通过音频和视频持续提供帮助。
为支撑这一长期布局,OpenAI已在2025年初斥资近65亿美元(IT之家注:现汇率约合455.06亿元人民币)收购乔尼·艾维联合创办的io,并同步推进供应链、工业设计与模型研发等多条工作线。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
OPPO Find N6折叠旗舰热销,三天销量超5.64万登顶榜单
OPPO Find N6 自3月20日开售以来,首销三天销量即突破5 64万台,仅凭借三天销售,进入当周( 2026 年第 12 周)中国市场手机激活量Top 30,也是榜单中唯一的折叠屏手机。业内
商用机器人炒菜普及率超94%,距离家宴美味还有几道坎?
3月11日,方太正式发布了方太全球首款机器人厨房。 这款烹饪机器人厨房,搭载业界首套“成长型”厨房具身智能系统。 高精度机械臂能够精准完成餐具取放、接水、洗碗机餐具摆放等精细动作;而人形机器人则
美团小象西南首店启幕:成华三大消费助力春启新程
00:57封面新闻记者 易弋力3月27日,美团小象超市西南开城仪式在成都万象城举办,春启成华三新促消费活动正式启动。联动全区商家、特色首店的成华消费场景上新月也同步进行中。尝鲜赏春正当时,从成华出发
京东物流第13架货机投用,渝长三角次晨达再加密
IT之家 3 月 28 日消息,3 月 27 日,京东物流旗下第 13 架全货机在重庆投用运营,并同步开通重庆 = 芜湖全货机航线。IT之家从最新介绍获悉,京东物流此次投用的 B738 货机满载吨位
AI违规致案件激增5倍:擅删邮件与滥用成隐患
IT之家 3 月 28 日消息,英国卫报昨日(3 月 27 日)发布博文,报道称由英国政府资助的一项最新研究显示,过去六个月内,AI 聊天机器人违抗人类指令、实施欺骗的真实案例激增五倍,总数近 70
- 日榜
- 周榜
- 月榜
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程

