纽约首席AI科学家杨立昆:机器学习将是复杂的工程学
机器学习研究被指类似“炼金术”,许多算法原理不明、依赖试错。Rahimi等提出切除分析、切片测试等改进措施。LeCun则认为这是复杂的工程学,过度强调基础理解可能拖慢创新。Recht主张平衡严谨研究与前沿探索。
在去年12月的一场AI会议上,谷歌AI研究员Ali Rahimi语出惊人,直接对当前机器学习领域的某些研究方法提出尖锐批评。他指出,机器学习算法——即通过反复试错让计算机自主学习的技术——已经发展到了类似“炼金术”的程度。更直白地说,许多研究者并不清楚为何某些算法有效而另一些无效,在选择AI架构时也缺乏足够严谨的理论依据。这一演讲最终赢得了长达40秒的热烈掌声。正如Rahimi所言,这个领域弥漫着一种“痛感”,不少人感觉自己正在与一种完全陌生的技术打交道。在近日于温哥华举办的国际学习表征会议(ICLR)上,他与合作者正式发表了一篇论文,不仅系统梳理了他们所观察到的“炼金术问题”,还提出了提升AI研究严谨性的具体“药方”。

这里需要先做一个区分。Rahimi批评的“炼金术”问题,与我们常说的AI“可复制性危机”并不相同——后者是因实验和发表流程不规范,导致同行无法重现结论。它也不等同于当前热议的“黑箱”或“可解释性”问题。正如Rahimi解释的那样,他试图将某个机器学习系统如何输出结果的“黑箱”,与整个研究领域在方法论上迷失方向、沦为黑箱的现象区分开来。
问题的核心在于:如果研究人员连构建和训练新算法所需的基本工具都尚未吃透,那么创造AI的方式,就与中世纪炼金术士依赖道听途说相差无几。同在谷歌的计算机科学家Francois Chollet则用了一个更形象的词来形容当下的氛围——“狂热崇拜”。他指出,很多人在研究中依靠的并非扎实的理解,而是“民间传说与魔法咒语”。举例来说,有人在调整AI的“学习速率”(即每次出错后算法自我修正的步幅大小)时,完全依赖于参数调整的信条,而不是真正理解为何某个速率更有效。还有些人训练算法,本质上就是在黑暗中摸索。他们中的多数会使用“随机梯度下降”这类方法来优化参数、降低误差,但尽管相关论文已有数千篇,真正能阐明背后机理的却寥寥无几,大多数还是依赖试错。
这种“炼金术”式的研究,代价相当显著。比如论文中举了一个非常反直觉的例子:当研究人员将某款公认最先进的语言翻译算法中的复杂模块全部移除后,其英语到德语、法语的翻译效率不但没有下降,反而得到了提升。这说明算法的创造者可能并未真正理解那些“额外部分”的具体作用。另一方面,推特的研究人员Ferenc Huszar也指出,某些情况下,算法中那些“花里胡哨的附加功能”恰恰是整个系统的精髓所在。他说,有时算法的核心本身存在技术缺陷,之所以还能取得不错的效果,“完全归功于算法上堆积的那些技巧”。
那么,如何改变这种局面?Rahimi给出了几个具体建议。首先,研究人员可以尝试“切除研究”——就像对待翻译算法那样,一次只去除算法的一个组成部分,观察缺少特定部件后的影响。他还呼吁推广“切片分析”,即对算法性能进行更细致的拆解与衡量,弄清某处改进是否会在其他方面带来成本。此外,他建议研究人员应在多种条件和设置下对算法进行测试,并将所有测试的性能如实报告在论文中。
加州大学伯克利分校的Ben Recht,也是Rahimi那篇“炼金术”演讲稿的合著者,建议AI可以借鉴物理学的思路。物理学家经常将复杂问题简化到一个非常简单的“玩具问题”中进行分析。在理解算法内在机制方面,物理学家那一套简化设计实验的本事,确实值得借鉴。事实上,已有不少AI研究者开始这么做——在处理大型彩色照片之前,先在小尺寸的黑白手写字符数据集上测试图像识别算法,以便更好地理解算法内部运作。
DeepMind的研究员Csaba Szepesvari则提出,这个领域需要降低对纯粹“竞赛式”排行榜的过度关注。他说,如今一篇论文如果报告算法在某些基准上跑赢了其他同行,就比那些讲清楚软件内部原理的论文更容易发表。这也解释了为什么前面提到那个“花哨”的翻译算法能够通过同行评审。科学家搞研究的初衷是产出知识,你所做出的成果应当让其他人能用得上、能在此基础上继续搭建。
当然,这番批评并非人人赞同。Facebook的AI首席科学家Yann LeCun表达了不同看法。他担心,如果过度将资源从前沿技术转向基础理解,可能会拖慢技术创新的步伐,甚至阻碍AI走向实际应用。他的判断很直接:“这不是炼金术,而是工程学。而工程学从来都是凌乱而复杂的。”
站在中间立场的Recht最终给出了一个很务实的观点。他认为,这个领域既需要系统性的严谨研究,也需要勇于冒险、推动边界的探索。两者不可相互替代:你只有搞明白故障源自哪里,才能构建真正可靠的系统;而只有不断拓宽疆界,才能沿着这条路找到性能更优的下一代系统。
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:纽约首席AI科学家杨立昆:机器学习将是复杂的工程学要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
相关热点交易决策的本质,始终是数据与判断力之间的博弈。如今,一款免费的AI平台——AI Trading Predictor——正致力于让数据占据更重要的分量,为股票、加密货币及商品交易提供实时预测与可视化支持。它并非神秘的黑箱魔法,而是将人工智能与市场数据深度融合,使普通投资者也能拥有接近机构级别的趋势分析
当前AI大模型正快速融入各个行业,但通用模型在处理垂直细分场景时往往精准度不足——例如法律文档审核、奢侈品真伪辨别、艺术品估价等任务,普通GPT难以提供可靠的答案。NeuralVault精准定位这一需求缺口:它针对法律文档分析、时尚奢侈品鉴定、艺术品估值、投资研究等专业领域,提供了一系列高度定制的G
加密货币交易圈子里,工具五花八门,但能真正把AI和实时数据结合到一块儿的,其实并不多。最近注意到一个叫CoinScreener的平台,它提供的不只是K线图,还有AI实时生成的信号——说白了,就是让机器帮你盯盘、帮你找机会。什么是CoinScreener?简单来说,CoinScreener是一个集实时
在股票与加密货币交易领域,AI 工具正逐步降低使用门槛,让更多人能够参与其中。今天要介绍的这款产品就是一个典型代表——它让完全没有编程经验的用户也能轻松创建个性化的交易策略。 什么是TraderGPT? 简单来说,TraderGPT 是一款由人工智能驱动的交易机器人。它的核心优势在于:用户不需要掌握
- 日榜
- 周榜
- 月榜
热点快看
