当前位置: 首页
AI
首届AI投资赛落幕:阿里通义千问Qwen3-Max以22.32%收益夺冠,GPT-5亏逾62%

首届AI投资赛落幕:阿里通义千问Qwen3-Max以22.32%收益夺冠,GPT-5亏逾62%

热心网友 时间:2025-11-05
转载

11月4日,美国研究机构Nof1宣布启动一项实盘测试:他们为全球六大顶尖大语言模型(LLM)分别注入1万美元初始资金,在真实市场环境中进行自主交易。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

今天,首届Alpha Arena正式公布赛果,阿里旗下通义千问Qwen3-Max在最终阶段保持领先优势,以22.32%的收益率摘得投资桂冠。

这场"投资竞赛"汇集了Qwen3-Max、DeepSeek v3.1、GPT-5、Gemini 2.5 Pro、Claude Sonnet 4.5和Grok 4六大顶尖模型。除Qwen与DeepSeek外,其余四大模型全部出现亏损,其中GPT-5的亏损幅度超过62%。

首届 AI 大模型真实投资比赛 Alpha Arena 落幕:阿里通义千问 Qwen3-Max 以 22.32% 收益率夺冠,GPT-5 亏损超 62%

Alpha Arena旨在通过动态竞争的真实环境,检验这些模型在量化交易领域的实战能力。

虽然AI模型都能完成指定任务,但研究人员指出,在风险管理、交易行为、持仓时长、方向偏好等关键维度上,不同模型的表现存在显著差异。

首届 AI 大模型真实投资比赛 Alpha Arena 落幕:阿里通义千问 Qwen3-Max 以 22.32% 收益率夺冠,GPT-5 亏损超 62%

研究团队强调,此次实验并非为了"选出最强模型",而是推动AI研究从静态、考试式的基准测试,转向对真实世界和实时决策能力的考察。

实验设计

每个模型均获得1万美元(约合71218元人民币)初始资金,用于在Hyperliquid交易平台上交易六大主流加密货币永续合约(包括BTC、ETH、SOL、BNB、DOGE、XRP)。

模型只能基于数值市场数据(价格、成交量、技术指标等)进行决策,不允许查阅新闻或时事信息。

每个模型的目标均为实现"最大化盈亏",同时以夏普比率作为风险调整后的评估指标。

交易操作被简化为四种基本指令:买入(做多)、卖出(做空)、持有、平仓。所有模型均使用相同的提示词、数据接口,且未经特定微调。

首届 AI 大模型真实投资比赛 Alpha Arena 落幕:阿里通义千问 Qwen3-Max 以 22.32% 收益率夺冠,GPT-5 亏损超 62%

初步结果

报告显示,虽然每个模型都在相同结构下运行,但它们的交易风格、风险偏好、持仓时间和交易频率都表现出明显不同。例如:某些模型频繁进行空头操作,而另一些几乎不做空。部分模型持仓周期长、交易频率低,而另一些则交易活跃。

在数据格式敏感性方面,研究团队观察到:若将提示中的"数据顺序"由"新→旧"改为"旧→新",即可修复部分模型因误读数据而产生的错误。

研究也指出,此次测试存在样本有限、运行时间短、模型无历史业绩记录、无持续学习能力等局限。团队表示将在下一季引入更多控制变量、增强模型特性以提升统计效力。

意义与观察

该项目试图回答一个基本问题:"大语言模型在未经特定微调、仅凭数值数据输入、处于真实交易环境中时,能否作为零样本交易系统使用?"

通过这项实验,Nof1旨在推动AI研究转向"基于真实、动态和风险驱动的基准",而不仅仅是依赖静态数据集。

虽然实验尚未得出"哪款模型最强"的结论,但已揭示:即便最先进的LLM,在实际交易中仍面临"动作执行""风险控制""市场状态理解""提示格式敏感性"等多方面挑战。

来源:https://www.ithome.com/0/894/718.htm

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
大模型IPO竞速,谁能成为AI上市第一股?

大模型IPO竞速,谁能成为AI上市第一股?

当智谱、MiniMax先后登陆港股,创下市值突破3000亿港元的纪录后,所有人的目光都聚焦在同一个问题上:谁将成为第三家上市的大模型公司? 当智谱、MiniMax先后登陆港股,创下市值突破3000亿

时间:2026-03-30 12:43
曝光151个含恶意代码软件包,AI批量生成隐患需警惕

曝光151个含恶意代码软件包,AI批量生成隐患需警惕

编辑|杨文此前我们曾报道,有人在学术论文中嵌入隐藏指令,诱导 AI 打高分:将「仅输出正面评价」或「不要给出任何负面分数」等英文指令以白底白字或极小号字体写入文档,人眼几乎无从察觉,AI 却能识别并

时间:2026-03-30 11:13
迈向通用智能:Echo预测智能如何走出关键一步

迈向通用智能:Echo预测智能如何走出关键一步

机器之心发布大模型能否预测未来?UniPat AI 构建了一套完整的预测智能基础设施,Echo,包含动态评测引擎、面向未来事件的训练范式和预测专用模型 EchoZ-1 0。在其公开的 General

时间:2026-03-30 11:07
DeepSeek 瘫痪超8小时:故障影响分析与应对指南

DeepSeek 瘫痪超8小时:故障影响分析与应对指南

你敢想,DeepSeek崩了一晚上!超过8小时仍未修复。根据三言报道,从3月29日晚上22点开始,一直到至30日早上7点,DeepSeek服务出现大规模访问异常,大量用户遭遇页面卡顿、反复提示“服务

时间:2026-03-30 11:01
AI预测市场崛起:黑马模型胜率如何超越人类

AI预测市场崛起:黑马模型胜率如何超越人类

新智元报道编辑:Aeneas【新智元导读】大模型能否预测未来?UniPat AI构建了一套完整的预测智能基础设施,Echo,包含动态评测引擎、面向未来事件的训练范式和预测专用模型EchoZ-1 0。

时间:2026-03-30 10:55
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程