欧洲版OpenAI:CEO详解DeepSeek-V3架构争议与构建初衷
最近一次访谈中,欧洲版OpenAI的联合创始人兼CEO Arthur Mensch声称,DeepSeek-V3是在Mistral提出的架构基础上构建的。这一说法在网络上引发了广泛争议。不少网友对此提出质疑,认为其中存在诸多不合理之处。
Arthur Mensch提到,Mistral是最早发布开源模型的公司之一,而中国开源AI的强势发展让他们看到了开源策略的优势。他强调,开源并非真正的竞争,大家是在彼此的基础上不断进步。他举例说,Mistral在2024年初发布了首个稀疏混合专家模型(MoE),而DeepSeek-V3及其后续版本都基于此架构构建,且Mistral公开了重建这种架构所需的一切。
然而,网友们指出,DeepSeek的MoE论文发布时间与Mistral论文仅相差三天,且两者架构思路并不相同。此前,Mistral 3 Large甚至被指基本照搬了DeepSeek-V3的架构。从数学公式来看,两者虽都采用GShard风格的Top-K路由器,但DeepSeek改变了传统MoE架构中的门控机制和专家结构。在专家粒度和数量方面,Mixtral沿用标准MoE设计,DeepSeek则提出细粒度专家分割,使专家组合更灵活。在路由机制上,Mixtral中专家地位平等,DeepSeek引入共享专家,实现了知识分布的解耦。
此外,有网友提到,Mixtral的论文并未提及训练细节,仅提到采用Google GShard架构和简单的路由机制。而2025年12月发布的Mistral 3 Large被发现直接沿用了DeepSeek-V3的架构。网友们认为,Mistral试图通过岁月史书来挽回面子,但DeepSeek在稀疏MoE、MLA等技术上已获得更大影响力。有网友调侃,现在的Mistral已非曾经惊艳大模型开源圈的那个Mistral了。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
4月汽车销量榜前十仅一款燃油车 燃油车时代即将落幕
四月新能源车零售渗透率突破61 4%,销量前十车型中仅剩一款燃油车。目前汽车保有量仍以燃油车为主,但市场趋势显示,车企正密集推出无需外接充电的油电混动车型,以满足充电不便用户的需求。同时,部分豪华品牌也放缓纯电路线,转向多元动力策略。油电混动成为连接燃油与电动化的重要。
ADC抗癌药市场迎来新入局者药企探索多元支付提升患者可及性
葛兰素史克ADC新药玛贝兰妥单抗在华获批,用于多发性骨髓瘤治疗。ADC药物市场快速增长,国内外药企加速布局,多款产品上市或通过授权合作出海。药企期待通过医保与商业保险等多元化支付体系提高药品可及性,减轻患者负担。
深圳福田AI生态亮相国际人工智能展
第七届深圳国际人工智能展览会开幕,福田区组织12家优质AI企业集体参展,涵盖芯片、硬件及行业解决方案。参展企业包括多家国家级高新技术与专精特新企业,聚焦算力硬件、垂直场景应用,展现区域产业活力与创新生态。展会为企业提供展示与合作平台,体现政策支持对AI发展的赋能作用。
央美陈抱阳解析AI与艺术融合情感认知智能技术如何革新美术教学
中央美术学院陈抱阳教授探讨了AI艺术的深层意义,强调研究应关注人如何观看AI及其对人类感知与情感的影响。他的创作融入中国文化传统,为具身智能艺术提供思想资源,不仅探索AI进入艺术的路径,更思考艺术如何重新定义AI的社会角色。艺术与AI的互动正改变技术理解、观看方式与教学逻辑。
方程豹豹5天神Max版上市 限时售价25.38万元
方程豹豹5天神Max版正式上市,限时售价25 38万元。新车核心尺寸与动力系统保持不变,系统总功率505kW。配置方面取消部分后排豪华功能,但保留了前排座椅加热通风按摩、中控与副驾娱乐屏及智能驾驶辅助系统,聚焦越野性能与核心科技,提供更具性价比的选择。
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

