当前位置: 首页
科技数码
时隔半年上海再出数学难题,AI挑战三道思维极限

时隔半年上海再出数学难题,AI挑战三道思维极限

热心网友 时间:2026-01-09
转载



1月6日,第十届世界华人数学家大会闭幕前夜,菲尔兹奖得主丘成桐与数学家们在上海向全球AI大模型出题,并按照难度高低分为三档,试图通过AI探求“人类知识边界”。

“与人脑计算相比,AI在高维计算中具备一定优势,但数学家更适合解决长期悬而未决的深度问题。”丘成桐表示,AI应与人类合作,弥补想象力不足,携手跨越数学界的“奇点”难题。

国产AI拿下高分

去年7月,在2025年世界人工智能大会上,丘成桐现场命题,上海人工智能实验室、商汤、阶跃星辰和MiniMax四款大模型同台解题,屏幕实时展示AI推理过程,首次向公众展示AI在数学方面的解题能力。

仅仅半年时间,国产AI大模型的数学能力就实现了快速迭代。

记者在现场看到,上海人工智能实验室的书生模型,在攻克一道涉及矩阵递归的前沿引理时,投入了长达数小时的深度推理。字节跳动Seed团队则采用强化学习训练,解题过程中正确证明获得奖励,错误则扣分,实现持续优化,每一步推理都必须符合逻辑规范,从根源上杜绝了“幻觉”现象。

通义千问模型在解答抽象代数难题时,推导过程中会主动自我验证,意识到自身推导中的逻辑漏洞,主动推翻了之前的结论,转而调用另一种方法进行交叉验证。而商汤的日日新模型则展现出了类似数学家的直觉,在解决复杂的广义积分时,没有采用暴力计算的方案,而是意识到函数的对称性,将难题化繁为简。

目前,国产AI大模型在各大数学竞赛中拿到高分。比如,字节Seed团队在国际数学奥林匹克竞赛中表现亮眼,博士级抽象代数题的解决率达到33%。在中国数学奥林匹克冬令营中,书生模型斩获102分的优异成绩,远超78分的金牌分数线。通义千问在考研数学题评测中,凭借纯文本单次推理拿到146.8分,若搭配代码工具辅助解题,在竞赛级题目中甚至能达到满分水平。

经典算法仍有生命力

“现在的AI参数已超万亿级了,正逼近极限,在这一时刻,数学经典算法理论更显重要。”在丘成桐看来,数学界还有很多“祖师爷”级别的经典算法,能给AI的底层算法突破带来希望。


丘成桐表示,AI计算和数学其实早有渊源。

上世纪60年代,计算机处理信号的复杂度被卡在了物理层面。随着数据量增加,计算时间呈指数级爆炸,那是硬件无法逾越的鸿沟。“当时大家觉得没路走了,直到1965年,库利和图基重新发现了快速傅里叶变换。这一下子就改变了整个工业界,没有它,就没有今天的互联网。”丘成桐表示,AI计算和数学其实早有渊源。

1976年,数学家借助计算机首次完成了困扰数学界百年的“四色定理”证明,即任何平面地图只需四种颜色就能让相邻区域颜色不同。这一证明的关键难点在于1800多种特殊验证工作过于繁琐,人力难以完成,而计算机则精准完成了逐一枚举验证。

随着算法和算力进步,计算机开始处理更复杂的数学问题。2016年,数学家再次通过智能计算解决了“布尔毕达哥拉斯三元组问题”。这一证明过程的计算量极为庞大,相当于一台高性能电脑连续运行4年,产生的原始数据量高达200TB,如此海量且复杂的计算任务,显然是人力难以企及的。

AI难寻数学“奇点”

“能解决奥数难题,就说AI替代数学家,这还为时过早,AI无法找到能够控制整个学问的‘奇点’。这需要依靠人脑和AI的结合。”丘成桐一针见血指出,AI可以解题,可以统计归纳海量数据,但无法提出宏大的数学猜想,提炼出原创性的理论和定理。

上海市人工智能行业协会秘书长钟俊浩也表示,AI擅长高强度的重复计算,可以将数学家从重复性的脑力劳动中解放出来,以便进行更高维度的思考。

目前,上海正围绕数学与AI融合的基础理论突破、AI辅助数学研究、产业场景转化三大前沿方向布局。费夫曼实验室(fefferman lab)与希钦-吴实验室(hitchin-ngo lab)两个菲尔兹奖获得者冠名实验室已在上海落地。

据悉,此次发布的三道数学题,不仅是一份考卷,更是上海向全球AI行业发出的“英雄帖”,分为初探、突破和拓界三种难度,前两种分别对应本科生和硕博难度,拓界则是面向全人类的终极猜想。

附:三道全球数学征解

初探:面向本科生的逻辑迷宫

突破:面向硕博的结构洞察

拓界:面向全人类的终极猜想


原标题:《时隔半年,上海再发“数学之问”,三道数学难题挑战AI极限》

栏目主编:李晔

来源:https://www.163.com/dy/article/KIQG4NCO055040N3.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
泰坦军团战魂KG277VPLUS双模显示器27英寸4K165Hz/520Hz仅1888元

泰坦军团战魂KG277VPLUS双模显示器27英寸4K165Hz/520Hz仅1888元

泰坦军团“战魂KG277VPLUS”27英寸显示器发售,支持4K165Hz与FHD520Hz双模切换,定价1888元。采用FastIPS面板,97%DCI-P3色域,配备升降支架及双HDMI2 1和双DP1 4接口。

时间:2026-07-03 12:53
苹果调价影响消费需求 2026年全球笔电出货量或降13.6%

苹果调价影响消费需求 2026年全球笔电出货量或降13.6%

迈入2026年,DRAM与NAND闪存的供应持续紧张及价格不断攀升,正逐步传导至终端消费市场。可以预见,下半年市场环境将更加严峻。上半年多家PC厂商已陆续上调产品定价,最终连苹果也不得不跟进,宣布提升iPad、Mac及家居设备的价格,以应对存储成本的快速上涨。 TrendForce分析指出,苹果全面

时间:2026-07-03 12:53
苹果iPhone 18 Pro自研C2芯片或不支持5G毫米波

苹果iPhone 18 Pro自研C2芯片或不支持5G毫米波

苹果自研C2芯片仅支持Sub-6GHz,不支持5G毫米波。因此,美版iPhone18Pro继续采用高通基带方案以支持毫米波,而其他地区版本则搭载苹果自研C2芯片。这一差异将导致在毫米波覆盖的市场中,用户峰值速率可能显著低于美版用户。

时间:2026-07-03 12:53
纳睿雷达推出睿宸超精细化短时临近AI气象大模型

纳睿雷达推出睿宸超精细化短时临近AI气象大模型

纳睿雷达近日释放了一项重磅成果。2026年7月1日,公司正式对外发布了两款自主研发的全新产品:一款是“WDSPT0152型”S波段全极化多功能有源相控阵雷达,另一款则是名为“睿宸”的超精细化短时临近AI气象大模型。从产品战略来看,此次发布直指气象监测与灾害预警领域的技术制高点。 先来看这款S波段雷达

时间:2026-07-03 12:53
南航国际创新港一期交付 四大专业园区打造空天产业强磁场

南航国际创新港一期交付 四大专业园区打造空天产业强磁场

近日,南京航空航天大学与六合区深度合作的标杆项目——南航国际创新港一期正式交付投用。两个地块陆续启用,成功串联起高校科研能量、地方产业载体与市场创新主体,为南京打造全国领先的航空航天产业创新中心、助力江苏布局商业航天全产业链,提供了坚实的物理支撑。 该创新港一期位于六合区雄州街道,分为3号和4号两个

时间:2026-07-03 12:52
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜