OpenAI夸大GPT-5数学能力遭删帖,杨立昆等业内专家质疑

10月19日消息,近期OpenAI研究人员在社交平台X上高调宣称取得一项重大数学突破,但很快便在学界批评声中撤回了相关说法。批评者包括DeepMind首席执行官德米斯·哈萨比斯(Demis Hassabis),他指出该团队的沟通方式"过于草率"。
事件源于OpenAI管理层成员凯文·韦尔(Kevin Weil)发布的一条现已删除的推文。他在文中声称,GPT-5已"找到了10个(!)此前未解的埃尔德什(Erdős)问题的解决方案",并在另外11个问题上取得了突破进展。他将这些问题形容为"数十年来一直悬而未决"。其他OpenAI研究人员也附议了这一说法。
这些措辞给人的印象是:GPT-5独立生成了数论领域若干难题的数学证明——这将是一项潜在的重大科学突破,也标志着生成式人工智能有能力推动原创性研究,发现未知解法,开启科技发展的新篇章。
然而,运营 erdosproblems.com 的数学家托马斯·布鲁姆(Thomas Bloom)立即提出异议。他称这一说法是"严重的误解",并澄清道:其网站上的"开放问题"仅表示他自己尚不了解答案,并不意味着这些问题在学术界真正未被破解。事实上,GPT-5只是检索到了布鲁姆此前未曾注意到的已有研究成果。
DeepMind CEO 德米斯·哈萨比斯将此次事件称为"令人尴尬的",Meta AI 负责人杨立昆(Yann LeCun)则讽刺OpenAI"被自己的炒作所反噬"(hoisted by their own GPTards)。
值得注意的是,相关原始推文随后大多被删除,研究人员也承认了错误。尽管如此,这一事件进一步加剧了外界对OpenAI的看法:这家机构正面临巨大压力且行事不够严谨。人们不禁质疑:在一个本就充满炒作、涉及数十亿美元利益的领域中,为何顶尖AI研究人员会未经核实就发布如此惊人的声明?事实上,即便是像Bubeck这样了解GPT-5真实贡献的研究者,仍然使用了"找到解决方案"这种具有误导性的模糊表述。
被忽视的真正重点在于:GPT-5在此过程中展现的实际价值,是作为一种高效的研究工具,用于追踪和整合相关的学术论文。这对于文献分散或术语不统一的研究问题尤其具有意义。
著名数学家陶哲轩(Terence Tao)认为,这才是人工智能在数学领域最直接的应用潜力所在——并非攻克最难的开放性问题,而是加速诸如文献检索等繁琐工作。他表示,虽然AI在个别复杂问题上已有"零星进展",但目前最主要的作用仍是节省时间的辅助工具。他还指出,生成式AI有望帮助"工业化"数学研究进程,从而加快整个领域的进步步伐。不过,他也强调,人类专家在审查、分类以及安全地将AI生成结果融入正式研究方面,仍然发挥着不可或缺的关键作用。
免责声明
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
OpenAI官方辟谣:2025年前无GPT-6发布计划
近期,市场上传出关于OpenAI下一代语言模型GPT-6的发布传闻。某行业分析师在社交平台发布预测称,这款备受期待的新模型有望在今年年底前正式亮相,并带来突破性的性能提升。该消息迅速引发科技圈热议,
智元G2软硬件协同优势显著,2026年或将快速放量
近日,国内知名机器人企业智元正式推出其最新力作——精灵G2机器人。这款机器人以工业场景下的高可靠性为设计核心,集成了高性能的关节执行器、多种类型的传感器以及强大的AI计算平台,展现出卓越的软硬件协同
专访天猫家洛:闪购创造增量,AI助力电商突破低价困局
今年双11迎来第十七个年头,淘天集团对主界面进行全面升级,推出三大创新亮点:首次实现大消费时代下的双11模式、全面落地人工智能应用、淘宝闪购业务深度参与。这些变革引发业界对线上线下渠道协调、AI技术
比特币矿企转型新路径:从挖矿到AI算力供应的估值重塑
随着人工智能与高性能计算需求激增,曾以比特币挖矿为主业的上市矿企正经历战略转型,其股价表现显著跑赢加密货币市场。追踪全球主要矿企的基金年内涨幅已超150%,远超比特币同期约14%的涨幅,标志着行业估
高盛报告:AI投资潮未达巅峰,生产力提升与算力需求持续增长
近期,人工智能领域的资本投入规模持续扩大,引发市场对投资过热风险的讨论。但高盛最新发布的行业分析报告认为,当前AI基础设施建设的资金投入仍处在合理区间,技术发展带来的经济效益足以支撑长期投入,相关投
热门推荐
热门教程
更多- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程



















