云栖首日重磅合集 Qwen2.5-72B成为全球最强开源模型
今天,2024云栖大会正式开幕 先说一个今天最重磅的消息——通义千问正式开源了Qwen2 5系列模型,性能直接超越Llama 405B,稳稳坐在“最强开源大模型”的位置上。在MMLU-redux等十多个基准测评中,Qwen2 5-72B的表现甚至压过了Llama3 1-405B一头,这可不是什么小打
今天,2024云栖大会正式开幕
先说一个今天最重磅的消息——通义千问正式开源了Qwen2.5系列模型,性能直接超越Llama 405B,稳稳坐在“最强开源大模型”的位置上。在MMLU-redux等十多个基准测评中,Qwen2.5-72B的表现甚至压过了Llama3.1-405B一头,这可不是什么小打小闹的升级。
直白点说,Qwen2.5支持高达128K tokens的上下文,一次性能生成最多8K tokens的内容。旗舰模型Qwen2.5-72B-Instruct在MMLU-redux、MATH、MBPP、LiveCodeBench、Arena-Hard、AlignBench、MT-Bench、MultiPL-E等一系列权威测评中表现亮眼。关键是,它在多个核心任务上,以不到Llama3.1-405B五分之一参数的规模,就实现了超越——这背后的技术含量,懂的都懂。
2024云栖大会首日 重点速览
上午,阿里巴巴集团CEO、阿里云智能集团董事长兼CEO吴泳铭发表了主题演讲。他在开场时就抛出了一个颇具分量的判断:“过去22个月,AI发展速度超过任何历史时期,但我们依然还处于AGI变革的早期。生成式AI最大的想象力,绝不是在手机屏幕上做一两个新的超级app,而是接管数字世界,改变物理世界。”
如果你错过了现场,以下几个核心观点值得仔细消化。
第一,过去22个月,AI发展的速度超过任何历史时期,但我们现在依然还处于AGI变革的早期阶段。
大模型技术迭代的速度之快,已经让“可用性”这个词彻底变了味。大模型现在不仅具备了文本、语音、视觉的多模态能力,还能直接理解复杂指令并完成执行。去年它还只能帮程序员写点简单代码,今年已经能直接理解需求,完成复杂的编程任务了。更夸张的是数学能力——去年还停留在中学生水平,今年已经拿到了国际奥赛金牌,而且在物理、化学、生物等多门学科上,已经逼近博士水平。
与此同时,模型推理成本的下降速度,已经远远超过了摩尔定律。过去一年,通义千问API在阿里云百炼上的调用价格下降了97%,百万Tokens调用花费最低降到了5毛钱。推理成本是应用爆发的关键瓶颈,而阿里云显然打算把这条成本曲线压得更低。
开源生态方面,今年6月通义千问开源Qwen2后,迅速登顶了Huggingface的全球开源模型排行榜。现在Huggingface上Qwen的原生和衍生模型接近5万个,排名全球第二。阿里云魔搭社区上已经有超过1万个模型,服务了超过690万开发者。
所有这一切都只是开始。要实现真正的AGI,下一代模型需要具备更大规模、更通用、更泛化的知识体系,同时也需要更复杂、更多层次的逻辑推理能力。全世界先进模型竞争的投入门槛,将达到数十亿甚至数百亿美金的级别。AI具备创造能力、帮助人类解决复杂问题的路径已经清晰可见,而这恰恰打开了AI在各行业场景中广泛应用的可能性。
第二,AI最大的想象力不在手机屏幕,而是接管数字世界,改变物理世界。
行业内很多人一直在琢磨,AI最大的应用到底是什么?会不会是手机上某个AI时代的超级App?但必须明确一点:AI最大的想象力绝对不在手机屏幕上。AI真正的想象力,在于通过渗透数字世界、接管数字世界,进而改变物理世界。不能只停留在移动互联网的视角去看未来。生成式AI最大的想象力,绝不是在手机屏幕上做一两个新的超级app,而是接管数字世界,改变物理世界。
过去三十年,互联网浪潮的本质是连接——连接了人、信息、商业和工厂,通过连接提高了世界的协作效率,创造了巨大价值,改变了人们的生活方式。但生成式AI是通过生产力的供给来创造新价值,从而为世界创造更大的内在价值。这种价值创造,可能是移动互联网连接价值的十倍甚至几十倍。
可以说,生成式AI将逐渐渗透数字世界,并接管数字世界。物理世界的大部分事物都会具备AI能力,形成下一代具备AI能力的全新产品,并与云端AI驱动的数字世界连接产生协同效应。很长一段时间里,AI的焦点主要集中在模拟人类的感知能力,比如自然语言理解、语音识别、视觉识别。但生成式AI的崛起带来了质的飞跃——AI不再仅仅局限于感知,而是首次展现了思考推理和创造的力量。
生成式AI让世界有了一个统一的语言——Token。它可以是任何文字、代码、图像、视频、声音,甚至是人类千百年来的思考。AI模型可以通过对物理世界数据的Token化,理解真实世界的方方面面,比如人类行走、奔跑、驾驶车辆、使用工具,绘画、作曲、写作、表达、教学、编程的技巧,甚至是开公司创业。理解之后,AI就可以模仿人类去执行物理世界的任务。这将带来新的产业革命。
汽车行业已经发生了这样的变革。以前的自动驾驶技术靠人来写算法规则,几十万行代码,仍然无法穷尽所有的驾驶场景。采用“端到端”的大模型技术训练后,AI模型直接学习海量人类驾驶视觉数据,让汽车具备了超越大部分司机的驾驶能力。
机器人将是下一个迎来巨变的行业。未来,所有能移动的物体都会变成智能机器人。它可以是工厂里的机械臂、工地里的起重机、仓库里的搬运工、救火现场的消防员,包括家庭里的宠物狗、保姆、助理。未来每个城市家庭可能有一辆或两辆车,而再过几年,每个家庭可能有两三个机器人,帮助人们提升生活中的效率。
AI驱动的数字世界连接着具备AI能力的物理世界,将大幅提升整个世界的生产力,对物理世界的运行效率产生革命性的影响。
第三,AI计算正在加速演进,成为计算体系的主导。
无论是端侧的计算还是云端的世界,这个趋势都已经非常明显。生成式AI对数字世界和物理世界的重构,将带来计算架构的根本性变化。过去几十年CPU主导的计算体系,正在加速向GPU主导的AI计算体系转移。未来几乎所有的软硬件都会具备推理能力,它们的计算内核将变成GPU AI算力为主、CPU传统计算为辅的计算模式。
从数据上看,在新增算力市场上,超过50%的新需求由AI驱动产生,AI算力需求已经占据主流地位。这一趋势还会持续扩大。过去一年,阿里云投资新建了大量的AI算力,但远远无法满足客户旺盛的需求。今天接触到的所有客户、所有开发者、所有CTO,几乎都在用AI重构自己的产品。大量新增需求正在由GPU算力驱动,大量存量应用也在用GPU重新改写。在汽车、生物医药、工业仿真、气象预测、教育、企业软件、移动APP、游戏等行业,AI计算正在加速渗透。在各行各业,一场看不见的新产业革命正在悄然演进。
所有行业,都需要性能更强、规模更大、更适应AI需求的基础设施。阿里云正以前所未有的强度投入AI技术研发和基础设施建设。单网络集群已拓展至十万卡级别,正在从芯片、服务器、网络、存储到散热、供电、数据中心等方方面面,重新打造面向未来的AI先进基础设施。
从历史经验来看,人们对新技术革命往往对短期高估,又对长期低估。在新技术应用早期,渗透率还比较低,大部分人的本能会产生怀疑,这很正常。但新技术革命会在人们的怀疑中成长,让很多人在迟疑中错过。
通往AGI的大模型发展之路
第一场圆桌对话的主题是“通往AGI的大模型发展之路”,聚焦当下关于模型的最热门话题。阶跃星辰创始人、首席执行官姜大昕在谈到OpenAI发布O1的意义时表示:“OpenAI发布O1,带来了一个Scaling Law的新方向。过去强化学习都是根据特定场景设计,AlphaGo只能下围棋,AlphaFold只能预测蛋白质结构。O1的出现,让强化学习的通用性和泛化性上了一个大台阶,而且scale到了一个很大的规模,不妨称之为RL Scaling。这等于找到了一条上限很高的道路。”
清华大学人工智能研究院副院长、生数科技首席科学家朱军在谈到AGI实现路径时表示,学术界、产业界有AGI L1-L5的分级——L1相当于聊天机器人,L2叫推理者,可以做复杂问题的深度思考;L3叫智能体,从数字世界走向物理世界;L4是创新者,能发现和创造新东西;L5是组织者,以更高效的方式运转。O1在L2的narrow场景下,在一些特定任务上已经实现了人类较高阶的智能水平,这确实代表着整个行业巨大的进步。
月之暗面Kimi创始人杨植麟则给AI产品的投资提了几条建议。核心还是对用户要有价值,其次要有增量价值,能够满足ChatGPT无法满足的用户需求。第三,随着技术发展,产品市场规模应该越来越大,而不是越来越小。
生成式AI重塑自动驾驶
第二场圆桌对话聚焦大模型在自动驾驶中的落地进展。小鹏汽车董事长、CEO何小鹏坦言,自动驾驶发展了许多年,但只能做到特定场景,比如高速或城市路段。原因是过去靠人工写算法规则,一个人无法用规则去应对世界上所有的驾驶场景。而端到端的大模型帮助我们提升了未来自动驾驶的高度,同时拉高了下限。他判断,未来36个月内,可以让每个人在每个城市都能像老司机一样开车。
何小鹏当天还驾驶“全球首款AI汽车”P7+亮相大会,这款车搭载了业内领先的端到端大模型。过去两年,小鹏汽车与阿里云共建的AI算力规模提升了超过4倍。他表示,将继续深化与阿里云的AI算力合作,加速推动端到端大模型拓展自动驾驶的上限和下限。
NVIDIA全球副总裁、汽车事业部负责人吴新宙也分享了他的观察:“端到端大模型对自动驾驶有两个阶段,都对上限有比较大的提高。第一个阶段是端到端,在现有架构上把上游模型和下游模型连接起来,用数据进行端到端训练。有了这个能力,自动驾驶的开发可以更多地变成数据驱动。第二个才是真正的端到端大模型,把通用大模型放到自动驾驶里,进一步提高上限。”
人形机器人的“图灵时刻”
第三场圆桌对话的主题是人形机器人的“图灵时刻”,探讨物理智能载体在大模型带动下发生的变化。
逐际动力创始人张巍分享了一个很有意思的观察:“这一代AGI相比上一代最大的区别,是从专用到通用的变化。在大模型出来之前,‘通用’这个词甚至有点像贬义词——通用就证明它没什么用。但大模型出现后,大家发现以前在专业领域里搜数据、做专项任务的训练方式有非常大的局限性。要先构建一个通用的基础模型能力,再在上面长出专用的能力,这才是系统化解决泛化性的关键。软件算法的通用性靠大模型技术,机器人跟物理世界交互的通用性,就靠人形机器人。”
北京大学助理教授、北大-银河通用具身智能联合实验室主任、智源学者王鹤则从技术路径上做了拆解:“现在的通用机器人虽然有一些技能,但几乎都是分立的小模型。大模型赋能这些技能分几步:第一步,大模型可以作为Agent调用API进行长程任务规划;第二步,大模型可以作为一个Monitor,监控小模型执行过程中是否出错,及时终止或调用别的技能来挽救;第三步是最有想象力的端到端——把Vision、Language、Action融为一体,像自动驾驶一样,实现一个把通用感知、通用规划和通用执行集成的大模型。”
清华大学交叉信息研究院助理教授、星动纪元创始人陈建宇指出了当前人形机器人技术中最关键的短板:“人形机器人技术分成三大块:大脑、小脑和本体。最关键的是小脑层面,它承接大脑的思考,调用硬件本体,真正帮我们到这个世界里干活。目前人形机器人的小脑部分反而最薄弱,也是技术不确定性最高、最没有收敛的。我们希望它的双腿能像人一样稳、快、灵活,帮助我们到达任何地方;希望它的双手能上得厅堂、下得厨房、进得工厂,做各种灵巧的事情。”
宇树科技创始人、CEO王兴兴对于机器人应用落地表示相对乐观:“我觉得到明年,人形机器人在一些固定场景做有商业价值的落地应用,基本问题不大。个人相对乐观,3年左右,全球范围内出通用型机器人AI的概率还是很大的。因为跟过去10年不一样,现在整个机器人AI的人才投入、资金投入都是巨量级的,几百倍甚至上千倍的增长,所以时间进展会更快。”
通义大模型全面升级
通义大模型在这次大会上宣布了年度升级。通义旗舰模型Qwen-Max全方位升级,性能已接近GPT-4o。通义官网和通义APP的后台模型都已切换为Qwen-Max,继续免费服务所有用户。相比去年4月最初的通义大模型,Qwen-Max的性能已经不可同日而语——理解能力提升46%、数学能力提升75%、代码能力提升102%、幻觉抵御能力提升35%、指令遵循能力提升105%,模型与人类偏好的对齐水平更是提升了700%以上。
通义千问三款主力模型再降价 最高降幅85%
继5月首次大幅降价后,阿里云百炼平台上的三款通义千问主力模型再次降价。Qwen-Turbo价格直降85%,低至百万tokens 0.3元;Qwen-Plus和Qwen-Max分别再降价80%和50%。其中Qwen-Plus推理能力追平GPT4,可应用于复杂任务,是效果、速度及成本均衡的最优选择。降价后,Qwen-Plus的性价比达到业界最高,同等规模较行业价格低84%。同时,阿里云百炼平台还为所有新用户免费赠送超过5000万tokens及4500张图片生成额度。
打造最强AI大基建
AI驱动下的阿里云全系列产品家族也迎来了升级。最新上线的磐久AI服务器支持单机16卡、显存1.5T,并具备AI算法预测GPU故障的能力,准确率达92%;阿里云ACS首次推出GPU容器算力,通过拓扑感知调度实现计算亲和度和性能的提升;为AI设计的高性能网络架构HPN7.0可稳定连接超过10万个GPU,模型端到端训练性能提升10%以上;阿里云CPFS文件存储的数据吞吐量达到20TB/s,为AI智算提供指数级扩展存储能力;人工智能平台PAI已实现万卡级别的训练推理一体化弹性调度,AI算力有效利用率超过90%。
阿里云正以AI为中心,全面重构底层硬件、计算、存储、网络、数据库、大数据,并与AI场景有机适配、融合,加速模型的开发和应用,打造一个AI时代的最强AI基建。
开放最先进的大模型
作为业内最早布局大模型技术的科技公司之一,阿里云去年4月发布首个大语言模型通义千问,如今通义大模型家族已全面涵盖语言、图像、视频、音频等全模态,性能均跻身世界第一梯队。同时通义模型持续开源,已成为最受企业和开发者欢迎的国产大模型。
此次开源的Qwen2.5全系列模型均在18T token数据上进行预训练,相比Qwen2拥有更多的知识、更强的编程和数学能力。Qwen2.5-72B模型在MMLU-rudex基准(考察通用知识)、MBPP基准(考察代码能力)和MATH基准(考察数学能力)上的得分分别高达86.8、88.2和83.1。Qwen2.5全系列涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型,每个尺寸都有基础版本、指令跟随版本和量化版本。模型拥有强大的多语言能力,支持中文、英文、法文、西班牙文、俄文、日文、越南文、阿拉伯文等29种以上语言。目前,中国一汽、联想、微博、携程、喜马拉雅、三得利(中国)等超过30万家企业客户已经接入通义大模型。通义系列大模型自开源以来,累计下载量已突破4000万,Qwen系列原生和衍生模型总数超过5万个。
通义万相发布全新文生视频模型
通义万相也全面升级,发布了全新视频生成模型,可生成影视级高清视频,适用于影视创作、动画设计、广告设计等领域。即日起,所有用户可通过通义APP及通义万相官网免费体验。首批上线的是文生视频和图生视频功能。在文生视频中,用户输入任意文字提示词,即可生成高清视频,支持中英文多语言输入,并可以通过灵感扩写功能智能丰富视频内容表现力,支持16:9、9:16等多种比例生成。在图生视频功能中,用户可将任意图片转化为动态视频,按照上传的图像比例或预设比例生成,同时通过提示词控制视频运动。
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:云栖首日重磅合集 Qwen2.5-72B成为全球最强开源模型要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
相关热点长城哈弗猛龙PLUS,近期在粤港澳大湾区车展上正式开启用户交付。说实话,这款插电混动SUV从5月15日上市至今,一直保持着较高的关注热度。它提供五座与七座两种座椅布局可选,最新指导价区间为16 98万至20 98万元;若叠加限时换新优惠,实际到手价格范围为16 18万到20 18万元——在20万级插
```html 近年来,随着Transformer与MOE架构的相继推出,深度学习模型的参数量已轻松突破万亿大关。模型规模越大,部署成本越高,推理性能也面临更大挑战。如何破解这一困局?这便引出了大模型压缩技术——我们亟需通过一系列方法,让这些庞大的模型既能高效运转,又不致吞噬过多的算力资源。模型压缩
先说个典型场景:你在本地调试得好好的Python脚本,突然弹出一个KeyError: user_id ,错误堆栈精准指向第47行的data[ user_id ]。这时候不需要慌,ChatGPT这种AI助手,30秒就能帮你定位到缺失的键,顺便把防御逻辑和测试用例都补上——环境也不用重装,文档也不用翻
2026年5月22日,智谱大模型公司股价盘中暴涨超32%,因发布GLM-5 1高速版API,输出速度达400Tokens s创全球纪录。市场对AI赛道关注升温,同一天MiniMax股价亦涨超20%。全球AI市场高速扩张,技术领先企业持续受益,但也需警惕短期波动风险。
- 日榜
- 周榜
- 月榜
热点快看
