首页
AI
通义千问Qwen3登顶全球AI模型,跻身最赚钱Top2

通义千问Qwen3登顶全球AI模型,跻身最赚钱Top2

热心网友
转载
2025-10-24
来源:https://36kr.com/p/3521684896045961

全球尖端大模型迎来王者更迭,Qwen3+Max上演逆袭好戏!就在今天,这款新秀凭借一套行云流水的凌厉操作,成功超越DeepSeek,登上冠军宝座。

它真是一骑绝尘,独领风骚!

大模型界这场精彩绝伦的“炒股”竞技,迎来了一位令人瞩目的新晋王者。

阿里的Qwen3+Max凭借精准的市场判断一跃而起,不仅超越了此前的冠军DeepSeek,更是首次登上“最会赚钱”大模型的榜首。

而GPT-5则接替了Gemini 2.5 Pro,成为了“亏钱大户”。照这个趋势发展下去,恐怕它离血本无归也不远了……

自23日实现反超之后,Qwen3+Max的领先优势一直在稳步扩大。

整个逆转过程相当耐人寻味。

21日迎来一波暴涨之后,所有大模型都在22日凌晨经历了一次集体回调。

期间,Claude 4.5 Sonnet直接将收益转为负数;Grok 4的表现也一落千丈。

相比之下,DeepSeek V3.1虽然有涨有落,但整体走势还算平稳。

而Qwen3+Max的表现就更具戏剧性了——虽然波动幅度不大,但它却率先开启了小步攀升的态势。

22日下午,Qwen3+Max先是稳步超越了Grok 4,随后在一轮市场波动后成功超越DeepSeek V3.1,首次登顶。

随后,Qwen3+Max与DeepSeek V3.1展开了激烈的拉锯战,直到23日上午,它再次实现了反超。

从Qwen的交易风格来看,它更偏向于稳健操作,在关键时刻总能“快、准、狠”地把握机会,这成为它能够逆势翻盘的关键所在。

截至14:40,Qwen3+Max的收益达到4438美金,DeepSeek V3.1则为2092美金。

Claude 4.5 Sonnet亏损1220美金,Grok 4亏损1699美金,Gemini 2.5 Pro亏损6054美金,GPT-5更是亏损了7148美金。

如今,全网都在为Qwen3+Max的惊人战绩喝彩。中国两大模型并驾齐驱,直接与北美顶尖水平形成了分庭抗礼之势。

唯一实现盈利的两款模型,均来自中国团队

这场火爆的大模型投资赛事Alpha Arena,由Nof1实验倾力打造。

他们为六大前沿模型分别配置了1万美元的实盘资金,让这些AI在真实市场中一较高下。

参与角逐的模型包括:Claude 4.5 Sonnet、DeepSeek V3.1 Chat、Gemini 2.5 Pro、GPT-5、Grok 4,以及此次的黑马Qwen3+Max。

按照规则,所有模型都在Hyperliquid交易平台上,使用相同的提示词和输入数据进行交易。

具体而言,系统会向AI提供当地时间、账户信息、持仓状况,并附上实时价格、MACD、RSI等关键技术指标。

在此基础上,大模型需要根据这些信息做出明确的交易决策——

若当前持有仓位,则判断是继续持有还是平仓;

若为空仓状态,则决定是开仓买入,还是保持观望。

这场比拼的核心目标很简单:在有效控制风险的前提下,尽可能多地为账户创造收益。用专业的术语来说,就是“最大化经风险调整后的收益”。

这意味着,每一个大型语言模型都必须独立完成以下任务:自主生成超额收益、决定仓位大小、把握交易时机,并对风险进行有效管理。

这项竞赛从18日拉开帷幕,已经连续进行了六天。

一直以来,DeepSeek V3.1凭借其独特优势稳坐第一把交椅。

Grok 4则始终紧跟DeepSeek V3.1的步伐,甚至有时还能与之形成分庭抗礼之势。

紧随其后的是Claude 4.5 Sonnet,它在20日经历了一波猛涨后,收益直逼Grok 4,甚至一度实现了反超。

而在这段赛程的激烈角逐中,Qwen3+Max虽然没有特别亮眼的表现,但却是其中最为稳健的一个。

从22日凌晨所有模型一同经历下跌之后,这场竞赛的整体走向又迎来了新的转折点。

接下来发生的事情,就是大家在开篇所看到的精彩情节了。

令人意想不到的是,仅仅一天时间,擂台上有实力竞争的模型,就只剩下DeepSeek V3.1和Qwen3+Max了。

要说最有意思的,还得是从第一天就开始持续亏损的Gemini 2.5 Pro和GPT-5。

首先,这哥俩的持仓策略和其他模型似乎完全不同。

19日,也就是开赛第二天,当其他模型都趁着风口赚得盆满钵满时,它们却反其道而行,在这条亏损的道路上一路狂奔。

后续不管是市场大涨还是大跌,它们几乎都无动于衷——这种“稳赔不赚”的表现确实相当稳定。

其次,它们也是所有模型中最热衷于频繁交易的。

23日中午,Gemini 2.5 Pro已经进行了超过100次交易,GPT-5则进行了40次。

相比之下,Qwen3+Max是22次,Claude 4.5 Sonnet是12次,Grok 4是10次,DeepSeek V3.1仅为9次。

伴随着这一通猛如虎的操作,它们的本金也快要赔光了——Gemini 2.5 Pro已不足4000美金,GPT-5更是只剩下不到2000美金。

不止于游戏,金融市场才是真正的试金石

十年前,DeepMind通过游戏对决,彻底改变了AI研发和评估的范式。

从围棋到“星际争霸”,他们证明了复杂的游戏环境可以成为AI能力的催化剂。

在游戏中,清晰的规则、可量化的目标、及时反馈的奖惩机制,都能让AI通过强化学习不断突破自我。

然而,Nof1提出了一个更具前瞻性的观点——

金融市场将是下一个AI时代的最佳训练场。

资本配置,是智慧不断趋近真理的历程

Alpha Arena主页上写着一句话:市场才是智能的终极试金石。

与游戏不同,金融市场是终极的“世界建模引擎”,也是唯一一个会随着AI变得更聪明而同步提升难度的基准。

对大型语言模型来说,需要实时理解不断变化的概率,权衡风险与回报。

AI面临的是一个更深刻的问题:能否在不确定性中持续生存。

而市场,是不会停下来等着AI去完成“反向传播”的。

这一次,Qwen3+Max的夺冠,证明了它在现实世界中真正的生存能力。

得益于强大的计算架构和海量数据训练,Qwen3+Max这次的逆袭路径堪称典范,也体现了阿里在多模态融合与强化学习上的创新。

这一成绩的意义,早已超越了比赛本身。

它再次向全球宣告,国产大模型已经具备了与国际顶尖LLM相抗衡的实力,并在高风险、高动态的金融“试金石”领域中领先一步。

免责声明

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章

夸克升级AI助手:阿里“C计划”重构工具矩阵与硬件布局

近期,阿里集团的一系列新动作引发了网络热议,相关消息不仅在国内广泛传播,还引起了外媒的关注。先是彭博社报道称阿里股价上涨,背后似乎有一个旨在挑战字节跳动的“C计划”。紧接着,路透社透露阿里推出了一款

2025-10-24.

网易《逆水寒》手游引入宇树机器人,优化动态捕捉流程

人工智能技术飞速发展,让不少职场人开始担忧自己的工作是否会被机器取代。尤其是近期机器人技术不断突破,AI机器人进入多个行业,既方便了人们的生活,也引发了新一轮的讨论。在这样的背景下,国内知名互联网企

2025-10-24.

85岁心理学家波佩尔:60年科研思考不息,活力不减的秘诀

在德国慕尼黑大学的校园里,一位银发学者仍保持着每日穿梭于实验室与办公室的习惯。这位85岁的心理学教授恩斯特·波佩尔,用六十余载的科研生涯诠释着 "学术永动机 "的真谛——作为德国国家科学院院士,他至今保

2025-10-24.

亚马逊“帮我决定”AI上线,用户偏好精准推荐提升购物效率

亚马逊近期在购物体验智能化领域再推新举措,全新上线的人工智能选品功能正逐步覆盖美国市场。该功能以 "帮我决定 "按钮为入口,当用户浏览同类商品时,系统将综合分析浏览轨迹、搜索关键词及历史购买记录,自动生

2025-10-24.

支付宝灵光APP内测:蚂蚁集团布局AGI多模态AI战略

蚂蚁集团旗下支付宝即将推出一款名为“灵光”的AGI多模态应用,目前该产品已进入内测阶段。用户可通过手机号或支付宝账号直接登录,这是蚂蚁集团继支小宝、安诊儿、AQ之后推出的第四款独立AI应用。据内部消

2025-10-24.

热门教程

更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程

最新下载

更多
宝宝房屋设计师
宝宝房屋设计师 休闲益智 2025-10-24更新
查看
猫咪模拟器
猫咪模拟器 休闲益智 2025-10-24更新
查看
修仙四万年正
修仙四万年正 角色扮演 2025-10-24更新
查看
僵尸作战模拟器国际
僵尸作战模拟器国际 飞行射击 2025-10-24更新
查看
斗魂大陆
斗魂大陆 角色扮演 2025-10-24更新
查看
鹅鸭杀国际服
鹅鸭杀国际服 休闲益智 2025-10-24更新
查看
云原神
云原神 角色扮演 2025-10-24更新
查看
我的汤姆猫旧
我的汤姆猫旧 休闲益智 2025-10-24更新
查看
植物大战僵尸随机模仿者
植物大战僵尸随机模仿者 休闲益智 2025-10-24更新
查看