拜拜Claude!阿里最强万亿模型编程秒了Opus4 实测在此

总参数达到1万亿,阿里迄今为止最大的模型来了!
没错,就是前几日大家期待已久的Qwen3-Max-Preview (Instruct)。
1万亿啥概念?几乎一下子就比前一代Qwen3(235B)多了四倍之多,相当于给大学生换了个爱因斯坦的脑子(bushi~
根据最新介绍,其最大亮点如下:
相较于2.5系列,新版本在中英文理解、复杂指令遵循、工具调用等维度实现了显著增强,同时大幅减少了知识幻觉,让模型更智能、更可靠。
而且发布即全面上线,目前可通过通义APP、 Qwen Chat网页和阿里云API体验。
更多最新测评显示,Qwen3-Max-Preview一登场不仅比自家前一代最强模型Qwen3(235B)更强,而且还打败了包括Claude Opus 4在内的国内外劲敌。
国内外反响更是一片热烈,随之而来的还有一大波测评:
1万亿!模型规模真是越来越扩张了,迫不及待想要尝试。
Qwen再次令人惊叹!
so,模型真实效果如何?不妨简单实测一下见真章。
支持多模态,编程已无需抽卡
综合最新测评和网友反馈,接下来我们主要考查Qwen3-Max-Preview解答难题和动手编程的能力。
需要提醒一下,阿里从Qwen3(235B)开始就不再使用混合思维模式,所以这次的Instruct版本仅支持非思考模式。
使用Qwen Chat网页,一上来就给它扔一道AIME数学竞赛题试试:
(AIME:美国数学邀请赛,是介于AMC10、AMC12及美国数学奥林匹克竞赛之间的一个数学竞赛。)
由于Qwen3-Max-Preview支持多模态,这里我们可以直接上传图片。
几乎转眼间,模型就唰唰唰地给出了详细作答过程及结果,最终答案“204”也与AIME这道题的标准答案一致。
小试牛刀过后,接下来进入编程环节。
用p5js创建多彩的可交互动画。
速度同样很快,Qwen3-Max-Preview几乎立即给出了一段完整代码,而且代码能够成功运行。
鼠标点到哪里,哪里就会产生交互效果:
生成一个扫雷游戏。
一句话制作扫雷这种经典小游戏也是轻轻松松,而且是一次成功,无需反复沟通和抽卡。
代码成功运行后,我们也简单试玩了一下,只是很快就“踩雷”了(doge):
最后来试试制作前端网页,不妨就让它来个自我介绍:
帮我制作一个介绍Qwen3-Max-Preview的可交互 。
代码生成后,既可以保存成文件直接打开,还能在问答末尾点击“预览”一键查看效果。
预览效果如下, 设计简洁直观,也具有初级交互效果:
当然,如果你更懂提示词,效果也会更好,某网友为Qwen3-Max-Preview制作的庆祝网页效果就还不错。
顺带一提,还有人对Qwen3-Max-Preview的生成速度进行了实际评估,大家可以感受一下:
以>107个token/秒的速度生成4467个token。
免责声明
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
最新文章
领益智造(002600.SZ):已为多家头部具身智能企业完成了数千套整机加工订单交付
格隆汇9月8日丨领益智造(002600 SZ)在投资者互动平台表示,在人形机器人领域,公司致力于成为全球头部具身智能硬件制造商,结合市场需求与技术发展路径,提供全身结构件的全工艺生产加工方案,提供伺
捷达VS8上市,德系品质与科技配置引关注
近日,汽车市场再度迎来新品发布,曾经耳熟能详的捷达车型如今已发展为独立品牌,推出了全新SUV车型VS8,于9月5日一口气推出三款车型,售价区间为9 59万元至10 99万元,价格颇具吸引力,引发了不
电光科技(002730.SZ):在少部分煤矿井下变电所配套使用了巡检机器人,数量不多
格隆汇9月8日丨电光科技(002730 SZ)在互动平台表示,公司在少部分煤矿井下变电所配套使用了巡检机器人,数量不多。
空洞骑士续作丝之歌解锁钢铁之魂模式挑战极限
对于熟悉空洞骑士的玩家来说,“钢铁之魂”模式并不陌生。在通关一次游戏后,这一极具挑战的模式会在标题界面解锁。该模式要求玩家仅能使用一条生命完成游戏,且一旦死亡,存档将彻底消失。作为续作,空洞骑士:丝
罗永浩犀利批评苹果灵动岛设计
近两年,苹果在其iPhone系列中引入了灵动岛设计,迅速引发了广泛讨论,并吸引了众多安卓厂商纷纷效仿。对于这一功能,科技评论人罗永浩表达了尖锐的批评意见。他表示,即便灵动岛加入了多项新功能,也只是“
热门推荐
热门教程
更多- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程



















