当前位置: 首页
AI
面壁李大海谈行业大模型发展历程与阶段性定位

面壁李大海谈行业大模型发展历程与阶段性定位

热心网友 时间:2026-05-15
转载

近日,在北京市石景山区人民政府、北京市经济和信息化局、北京市科学技术委员会中关村科技园区管理委员会联合主办的服贸会分论坛——“通用人工智能算力论坛”(AGICF)上,面壁智能正式发布了千亿参数多模态大模型“露卡”(Luca),并开启了其2.0版本的全民公测。

“露卡”之名,源于地球生命始祖的英文缩写(The Last Universal Common Ancestor),寓意着对通用人工智能本源探索的雄心。回顾其发展历程,今年5月底的2023数博会上,Luca 1.0首次公开亮相。随后的三个月里,模型经历了85次快速迭代,其大语言模型核心能力整体提升了39%。尤为突出的是推理能力,实现了119%的跃升,在推理、知识、生成等多个维度已可媲美ChatGPT。

此次推出的Luca 2.0,不仅延续了强大的语言模型能力,更关键的是集成了卓越的多模态处理能力。其图片理解能力,在中文语境下已处于领先水平。在多模对话、细节描述和复杂推理三项综合评测中,Luca 2.0取得了92.5分的整体得分,远超行业其他支持中文图片理解模型78.4分的平均分。

论坛结束后,面壁智能CEO李大海接受了媒体群访,就通用大模型的路径选择、近期热议的一体机模式、知乎数据对训练的独特价值以及大模型评测等热点话题,分享了团队的思考与实践。

1. 坚定走向通用大模型之路

问:目前资本与科技圈对大模型的态度似乎呈现“冰火两重天”,您当前关注的核心问题是什么?

李大海:当前行业普遍聚焦于大模型如何落地。我们的精力主要分配在几个方面:首先是模型的封闭式专项开发,这种模式效率极高,使得团队能在三个月内将模型从百亿参数规模推进到千亿级别,这个过程挑战巨大。另一方面,则是在持续思考哪些是真正值得投入的应用方向,以及应用如何与大模型深度结合。这里就引出了一个根本性问题:大模型与应用的关系。

我们坚信,必须致力于开发“大模型原生应用”。这类应用应构建于大模型之上,其存在本身便依赖于大模型的能力。反观当下,不少应用只是在现有流程中接入了大模型API,虽然能带来一定效率提升,但这并非典型的原生应用。当然,我们也不认为原生应用就意味着100%由大模型驱动,那无异于“拿着锤子找钉子”。真正的关键在于关注用户的真实需求,审视在引入大模型这一变量后,需求是否能被更优地满足。

问:如何看待B端业务及行业大模型的发展前景?

李大海:B端业务我们同步在开展,但现阶段更侧重于C端。过去半年,我们看到许多同行被客户需求推着走,疲于应付项目制的定制化要求。在模型标准化尚未完善的情况下,提供这类服务需要投入大量人力进行填补,交付效率是个问题。

商业的本质要求我们必须关注效率与健康的损益结构。纯粹的ToB项目制模式,其定位和毛利率往往面临挑战。要实现高效交付,路径无非两条:要么针对特定场景训练一个相对优秀的模型,再为每家客户进行微调;要么打造一个足够通用的强大模型,使其能通过轻量微调适配各种场景。我们相信,未来一定属于通用人工智能的方向。

现阶段,行业大模型凭借更小的参数量在垂直领域成本占优,加之通用大模型的能力尚未全面碾压,因此有其存在空间。但可以预见的是,未来必然会出现能力更强、成本更低的通用模型,届时它将极大挤压甚至抹平行业模型的市场空间。因此,行业大模型更多是当前技术阶段的过渡性产物。

问:面壁大模型从百亿跃升至千亿,与团队此前“悟道2.0”时期从百亿到千亿的进化有何不同?

李大海:从技术路线上看,当时推出的CPM2千亿模型采用的是MoE稀疏架构,与当前发布的千亿模型在结构上有所不同。我们现在的千亿模型是Decoder-only的网络架构。值得一提的是,CPM大模型是面壁智能从零开始自主研发的预训练大语言模型系列,其中包含了国内首个中文大模型CPM-1。而CPM-Live项目第二期开源的百亿模型CPM-Bee,作为国内首个免费商用的开源基座模型,目前已授权数百家企业使用。

问:发布千亿多模态大模型,是否会影响团队在大语言模型(LLM)上的研发重心?

李大海:需要明确的是,公司的核心资源依然聚焦于大语言模型,这是所有能力的基石,必须首先夯实,这也是我们的阶段性战略。我们的优势在于产学研紧密结合,大语言模型的研发不仅是公司行为,更是与顶尖实验室深度合作的结果。将大语言模型这个基座做得越来越扎实,我们才能更顺畅地接入多模态数据与学习任务,这是一个水到渠成的过程。

问:知乎提供的数据集对模型训练带来了哪些独特优势?

李大海:模型能取得优异成绩,知乎高质量图文数据的贡献功不可没。知乎作为一个高质量社区,用户在上传图片时,往往会精心配以详细的文字说明。这种用户生成内容的质量,远高于第三方标注平台生产的标准化数据,为模型理解图文关联提供了极为宝贵的素材。

2. 开源、竞争格局与一体机

问:如何看待开源大模型在ToB领域的影响?

李大海:目前来看,开源对于厂商的主要价值仍在于提升模型的影响力和知名度。因为当前的开源生态尚未形成类似安卓的完整体系,例如客户用自己的数据训练后,数据不会回流,模型的实际使用效果也难以获得集中反馈。这种影响力的提升对ToB业务有帮助,但链条较长,效果比较间接。

当竞争进入深水区,各家模型能力趋同时,客户会更关注服务提供商自身的持续运营能力、售后保障等综合实力。这很像电动汽车行业的发展初期,百花齐放时早期用户多为尝鲜者;但当大众市场启动后,品牌的制造体系、服务网络等综合能力就成为关键。

问:通用大模型的未来,更可能诞生于大公司还是创业公司?

李大海:参考美国市场,头部科技公司也并未垄断通用大模型的全部疆域。这件事的成败,归根结底取决于公司的创新能力。这是一个由人才、资源、组织效率、创新容忍度、战略定力等多重变量共同决定的综合竞赛,并无定式。

问:如何看待当前流行的大模型评测榜单?

李大海:在大模型领域,榜单本身似乎陷入了一个悖论。一旦某个榜单获得广泛认可,就几乎必然引发“刷榜”行为,这很难避免。除非未来能出现一个由大模型动态、随机生成题目,且公信力得到公认的评测体系。目前来看,为时尚早。

核心原因在于,大模型的“背题”能力极强。只要题目被获取并喂给模型,它就能迅速记住答案。我们观察到一个有趣的现象:模型一旦能“记住”,它往往就放弃了“理解”。

问:Luca公测以来,收到的使用申请情况如何?

李大海:正式发布后,我们收到了大量使用申请,团队正在逐一审核批准。目前推理资源仍处于限量供应阶段,具体数字不便透露。我们会根据服务需求,动态提升供给能力。

问:传闻面壁也在筹备大模型一体机,您对此模式持何看法?

李大海:关于一体机,我们确实在与合作伙伴紧密推进,但具体进展暂不便透露。从市场角度看,一体机是国内ToB市场特定环境下的产物。其产生背景在于,部分国内企业客户习惯性地低估软件价值,而高估硬件价值。软硬件一体化的形态,有时更能体现产品的整体价格。

不过,从技术发展趋势而言,更看好云服务模式。将复杂的运维、算力调度等工作交给专业的云厂商,模型研发公司才能更专注于核心的算法与模型创新本身。

来源:https://www.leiphone.com/category/ai/23kbzQXj60xZgUgO.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
阿里钉钉文档全功能解析在线协同办公套件使用指南

阿里钉钉文档全功能解析在线协同办公套件使用指南

钉钉文档官网 在探讨企业级协同办公解决方案时,钉钉文档无疑是备受瞩目的核心工具之一。作为阿里巴巴钉钉官方推出的旗舰级应用套件,它深度融合了在线文档编辑、智能表格、思维导图等多种高效创作工具。其核心优势在于与钉钉平台生态的无缝衔接,能够直接同步企业内部组织架构与通讯录,实现团队成员间的即时协作与信息流

时间:2026-05-15 23:00
商汤小浣熊智能助手基于自研大语言模型

商汤小浣熊智能助手基于自研大语言模型

在数字化转型浪潮中,高效、易用的数据分析工具已成为企业提升决策效率的关键。商汤科技推出的“办公小浣熊”智能助手,正是基于自研大语言模型打造的一款创新产品,旨在彻底降低数据分析的技术门槛。用户无需掌握编程知识或复杂操作,即可通过自然对话完成从数据查询、处理到可视化洞察的全流程,让数据价值触手可及。 办

时间:2026-05-15 22:59
MiniMax新一代智能模型矩阵全面解析与应用指南

MiniMax新一代智能模型矩阵全面解析与应用指南

在人工智能技术快速发展的今天,MiniMax作为一家专注于全栈自研的AI公司,正以其独特的技术路径和前瞻性的布局,在业界脱颖而出。公司致力于构建覆盖文本、图像、语音和视频的新一代多模态智能模型矩阵,这不仅体现了对核心底层技术自主权的深度掌控,也展现了对未来人机交互与内容生成形态的前瞻思考。 那么,M

时间:2026-05-15 22:59
智能客服机器人解决方案:AI客服系统提升企业服务效率

智能客服机器人解决方案:AI客服系统提升企业服务效率

在数字化转型浪潮中,一套能够深度适配业务、彰显品牌特色的智能客服系统,已成为企业提升服务效率与用户体验的关键工具。然而,市场上许多解决方案往往模式固化,难以满足个性化需求。如何让AI客服不仅具备基础的自动化应答能力,更能承载独特的品牌文化与服务哲学?其核心在于系统是否支持深度的自定义与持续的AI训练

时间:2026-05-15 22:59
开源企业答疑工具Danswer:高效解决团队知识管理难题

开源企业答疑工具Danswer:高效解决团队知识管理难题

Danswer 是一款专为企业设计的开源智能问答平台,支持用户使用自然语言直接提问,并能够从公司内部文档、知识库等私有数据源中快速检索,提供带有精准来源引用的可靠答案。 核心功能:它如何解答问题? Danswer 的核心价值在于实现了“智能问答”。用户无需再花费大量时间手动搜索和翻阅各类文件,只需像

时间:2026-05-15 22:59
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程