拜拜Claude!阿里最强万亿模型编程秒了Opus4 实测在此

总参数达到1万亿,阿里迄今为止最大的模型来了!
没错,就是前几日大家期待已久的Qwen3-Max-Preview (Instruct)。
1万亿啥概念?几乎一下子就比前一代Qwen3(235B)多了四倍之多,相当于给大学生换了个爱因斯坦的脑子(bushi~

根据最新介绍,其最大亮点如下:
相较于2.5系列,新版本在中英文理解、复杂指令遵循、工具调用等维度实现了显著增强,同时大幅减少了知识幻觉,让模型更智能、更可靠。

而且发布即全面上线,目前可通过通义APP、 Qwen Chat网页和阿里云API体验。

更多最新测评显示,Qwen3-Max-Preview一登场不仅比自家前一代最强模型Qwen3(235B)更强,而且还打败了包括Claude Opus 4在内的国内外劲敌。

国内外反响更是一片热烈,随之而来的还有一大波测评:
1万亿!模型规模真是越来越扩张了,迫不及待想要尝试。

Qwen再次令人惊叹!

so,模型真实效果如何?不妨简单实测一下见真章。
支持多模态,编程已无需抽卡
综合最新测评和网友反馈,接下来我们主要考查Qwen3-Max-Preview解答难题和动手编程的能力。
需要提醒一下,阿里从Qwen3(235B)开始就不再使用混合思维模式,所以这次的Instruct版本仅支持非思考模式。
使用Qwen Chat网页,一上来就给它扔一道AIME数学竞赛题试试:
(AIME:美国数学邀请赛,是介于AMC10、AMC12及美国数学奥林匹克竞赛之间的一个数学竞赛。)

由于Qwen3-Max-Preview支持多模态,这里我们可以直接上传图片。
几乎转眼间,模型就唰唰唰地给出了详细作答过程及结果,最终答案“204”也与AIME这道题的标准答案一致。

小试牛刀过后,接下来进入编程环节。
用p5js创建多彩的可交互动画。
速度同样很快,Qwen3-Max-Preview几乎立即给出了一段完整代码,而且代码能够成功运行。
鼠标点到哪里,哪里就会产生交互效果:

生成一个扫雷游戏。
一句话制作扫雷这种经典小游戏也是轻轻松松,而且是一次成功,无需反复沟通和抽卡。
代码成功运行后,我们也简单试玩了一下,只是很快就“踩雷”了(doge):

最后来试试制作前端网页,不妨就让它来个自我介绍:
帮我制作一个介绍Qwen3-Max-Preview的可交互 。
代码生成后,既可以保存成文件直接打开,还能在问答末尾点击“预览”一键查看效果。

预览效果如下, 设计简洁直观,也具有初级交互效果:

当然,如果你更懂提示词,效果也会更好,某网友为Qwen3-Max-Preview制作的庆祝网页效果就还不错。

顺带一提,还有人对Qwen3-Max-Preview的生成速度进行了实际评估,大家可以感受一下:
以>107个token/秒的速度生成4467个token。

免责声明
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
德国卡赫千年王宫清洁经:前沿科技缔造极致净界
坐落于赣江之畔的滕王阁,不仅是中华建筑史上的瑰宝,更是承载千年文脉的精神地标。时光流转,岁月的痕迹早已爬上这座“江南名楼”,昔日鲜亮的古建逐渐失去光彩。近日,全球清洁行业领军者德国卡赫受邀而至,为这
上海地铁崇明线新进展:全线隧道贯通助推长三角交通提速
国内轨道交通建设领域传来喜讯,上海地铁崇明线建设取得重大突破——全线隧道实现贯通,这条穿越长江距离最长的轨道交通线路正式迈入建设新阶段。作为上海市轨道交通22号线的重要组成部分,崇明线陈家镇站至陈东
99元流量卡深度评测:实测揭示适用人群与避坑要点
近年来,随着移动网络需求激增,各类流量卡产品层出不穷,其中电信推出的99元“无限流量”套餐因宣称“流量自由”引发广泛关注。但用户实际体验是否如宣传所说?一位使用该套餐三年的老用户分享了真实感受,揭示
3.1亿老人慢病困扰:AI如何缓解25%凌晨失眠困境
(图片来源:摄图网)近日,蚂蚁集团AI健康应用AQ披露的一组数据,道出了老年群体在健康管理中的真实困境与迫切需求。在AQ平台上,60岁以上用户占比接近20%,其中,12%的老人会通过拍摄药盒的方式,
上汽智己LS9开启预售:11月4日首发,长续航与行业配置成亮点
上汽集团近日正式宣布,旗下旗舰车型智己LS9将于11月4日19时开启预售。这款定位高端的新能源SUV凭借多项行业首创技术,成为近期市场关注的焦点。在核心技术层面,智己LS9搭载的灵犀数字底盘3 0系
相关攻略
热门教程
更多- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程








