Gary Marcus批评文本生成图像系统缺乏世界理解能力
自从 DALL-E 2 惊艳亮相,一个观点便开始流行:能够绘制逼真图像的 AI,无疑是迈向通用人工智能(AGI)的关键一步。OpenAI 的 CEO Sam Altman 在发布 DALL-E 2 时那句“AGI is going to be wild”的宣言,更是被媒体广泛引用,用以渲染这类系统对于智能革命的重大意义。
然而,事情真有这么简单吗?对此,知名 AI 学者、以审慎看待 AI 进展著称的 Gary Marcus 就持保留态度。
他最近提出,评估 AGI 的进展,关键在于审视像 DALL-E、Imagen、Midjourney 和 Stable Diffusion 这样的系统,是否真的“理解”了我们所处的世界——这种理解,意味着能够基于知识进行推理并做出决策。
那么,要判断这些图像生成系统之于 AI(无论是狭义还是广义)的真正价值,不妨从以下三个核心问题入手:
图像合成系统能否生成高质量的图像?
它们能否将语言输入与它们产生的图像准确关联起来?
它们是否了解自己所呈现图像背后的那个真实世界?
AI 不懂语言与图像的关联
对于第一个问题,答案是肯定的。区别或许只在于,经过专业训练的人类艺术家,能更娴熟地运用这些工具,产出更具艺术性的作品。
但到了第二个问题,答案就不那么确定了。在某些特定的、符合常规逻辑的语言描述上,这些系统确实表现不俗。比如,让 DALL-E 2 生成一张“骑着马的宇航员”的图片,它就能交出令人满意的答卷:

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
摩尔线程携手光轮智能达成战略合作共促AI发展
近日,国产全功能GPU领域的领军企业摩尔线程,与全球领先的物理AI数据与仿真基础设施企业光轮智能,正式宣布达成战略合作。双方将依托摩尔线程的全功能GPU与夸娥(KUAE)智算集群,结合光轮智能“求解—测量—生成”三位一体的全栈自研仿真平台,共同打造高置信度的仿真数据合成方案。这标志着国产算力与仿真算
Anthropic产品负责人Cat Wu谈AI未来趋势 预判用户需求成关键
当整个科技界的目光都聚焦于AI模型的军备竞赛时,有一家公司正悄然迎来自己的高光时刻——Anthropic。 这家公司正走在一条超越主要竞争对手的快车道上。一方面,它寻求筹集数百亿美元资金,此轮融资估值或将达到约9500亿美元,这个数字已经超过了OpenAI在今年3月融资轮中创下的8540亿美元估值。
宏胜集团高管变动与业务外包调整深度解析
宏胜集团近期发生重要人事与业务调整。总裁办主任叶雅琼、销售总经理吴汀燕、法务部部长周卓盈及生产管理科科长吴潘潘等多位高管已离职,该消息已获接近集团人士证实。与此同时,集团启动了部分非生产业务的外包运作,显示出其正在优化内部结构与运营模式。这一系列变动可能意味着公司正处于战略调整期,旨在聚焦核心业务并
碳化硅衬底价格承压行业竞争加剧 天岳先进提示技术迭代风险
天岳先进发布公告,就其股票交易异常波动进行说明,并提示行业风险。公告指出,近期券商对公司业绩的预测属单方面行为,未经公司确认。公司强调,所处的碳化硅半导体衬底行业正面临市场竞争日趋激烈、产品价格下行压力增大的局面。同时,行业技术迭代速度加快,若无法持续保持技术领先并适应市场变化,将面临市场份额与业绩
锐捷网络1.6T LPO光模块预计2026年送样研发进展
锐捷网络近日公布了其高速光模块产品线的最新进展。目前,400GLPO光模块已实现规模量产交付,800G光模块处于样机小规模适配阶段。面向未来更高速率需求,公司已开始研发1 6TLPO产品,并预计在2026年内提供送样。这些产品主要面向需要高性能计算网络的互联网厂商,作为其数据中心交换机整体解决方
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

