对话APUS李涛揭秘AI转型大模型蒸馏训练与中小模型沉淀

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

对话APUS李涛揭秘AI转型大模型蒸馏训练与中小模型沉淀

热心网友时间：2026-05-15

转载

走进融新科技中心A座23层，绿植与野营桌椅帐篷构成了一幅轻松的画面。在这里，我们见到了APUS创始人李涛，一身休闲装，神态放松。访谈还没开始，他就用八个字概括了创办APUS的心路——“享受过程、追求快乐”。整个对话中，“快乐”一词被反复提及。令人印象深刻的是，关于创业压力与至暗时刻的抱怨很少，取而代之的，是一种应对行业变局的从容。

据说，APUS选择办公地点时偏爱高层。原因很简单：狭窄的格子间容易带来压迫感，而开阔的视野能让团队心境更宽广。站在他们办公室的窗前，北京的地标建筑“中国尊”清晰可见。

李涛是国内最早一批接触大模型的业内人士。早在2019年，他就与字节跳动创始人张一鸣、红杉中国创始人沈南鹏在硅谷会见了OpenAI创始人Sam Altman。这次会面，为APUS日后全面转向人工智能埋下了伏笔。

2022年11月底，ChatGPT的横空出世引爆了全球关注。随后，谷歌宣布推出Bard，微软则将大型语言模型深度整合进Office套件。国际科技巨头在大模型领域的角逐，至今仍未停歇。

国内市场同样风起云涌。今年2月ChatGPT在国内出圈后，互联网大厂迅速入场。百度率先官宣“文心一言”，阿里、腾讯、360等也相继加入战局。虽然一些厂商尚未推出可商用的产品，但大部分都已将重心转向大模型研发。

在这场全球性的AI竞赛中，APUS的布局显得更早一些。这家成立于2014年的全球化移动互联网公司，以工具产品起家，逐步拓展至内容与服务，目前全球用户已超24亿。面对AI风口，APUS在2019年便开始相关探索，并于去年底正式启动“大AI战略”，比国内这波热潮早了近两个月。

从移动互联网公司转向人工智能，李涛认为这与公司的定位转变密不可分。“2020年以前，我们定位自己是‘中国出海企业’；之后，我们升级为‘全球化公司’。这个定位决定了我们能更早感知到全球技术浪潮的变化。去年底，我们真切感受到了AI带来的竞争压力与巨大潜力，于是决定全面拥抱AI。”

一、“不要抱着补偿心理创业，创业者要享受过程”

问：您如何看待创业这件事？

李涛：创业是一个动态过程，它既不是起点，也不是终点。创业者必然会经历高光与低谷。如果只盯着三五年后的某个成功时刻，那么高光过后，落寞感也会随之而来，这是自然规律。所以，创业者不必为了追求某个特定时刻而苦苦煎熬，更重要的是享受整个过程，从中获得快乐。

问：所以您属于很享受过程的人？

李涛：是的。做事首先要顺势而为，其次要学会造势，最后是享受过程。把这三件事都做到，心态自然会平衡，成功之后也不会有强烈的“补偿心理”——觉得过去太苦了，现在必须加倍索取。

问：要想创业成功，什么特质最重要？

李涛：积极且稳定的心态。市场上有些上市公司并不赚钱，部分原因就在于创始人觉得创业过程太苦，上市后补偿心理过重，这种心态反而会阻碍企业走向真正的成功。相反，那些能持续处在高光期的企业，其领导者往往是在享受创造价值的过程，并非单纯追求某个里程碑。这种积极心态，会带来正向的循环效应。

创办APUS以来，业务增长很快，因为创造了社会价值，我也从中感受到快乐。没有补偿心理的负担，反而更容易做出清醒的判断，让企业保持健康的发展态势。

二、全球化视野提前感知AI变革，决定全面转型

问：APUS如何定位自己？

李涛：我们是一家以产品技术为核心的全球化移动互联网公司。2014到2019年，我们专注于出海业务，定位是“中国出海企业”。2019年战略升级后，我们将自己定位为“全球化公司”，中国、美国或其他市场，都只是我们选择的区域市场之一。

问：决定全面转型人工智能，有什么具体的契机吗？

李涛：ChatGPT的出现，再次暴露了国内互联网全球化程度不足的问题。其实去年10月，ChatGPT就在美国校园火了，但这个概念直到今年2月才在国内形成热潮。这意味着，国内在技术意识的感知上，可能比美国晚了三到四个月。而作为一家全球化企业，APUS的感知模型天然具备全球视野，我们去年就已经接触到ChatGPT并开始了相关研究。

问：APUS最早是如何切入的？

李涛：我们从AIGC入手。但很快发现，ChatGPT所代表的语言模型训练，其挑战远大于AIGC。如今很多所谓的AIGC，其实只能算中等模型，并非真正的大模型。

问：所以像谷歌这样拥有海量数据的公司，在大模型上最有优势？

李涛：未必。这类公司往往面临“自我革命”的难题。搜索引擎建立在归纳法之上，并由此形成了成熟的商业模式。让它们彻底转向演绎法逻辑的大模型，非常困难。谷歌做大模型多少有些被动，因为已经落后，就只能遵循OpenAI制定的规则。即便未来谷歌做出了超越OpenAI的模型，它很可能也会试图将技术拉回自己熟悉的赛道，以发挥原有优势，这反而可能导致再次落后。这是巨头们的普遍痛点。

问：如果中国出现下一个OpenAI，您认为小公司比大公司的机会更大？

李涛：对。目前有能力尝试GPT的，大多是互联网企业，但它们往往有沉重的既得利益包袱，不愿轻易舍弃。因此，像王慧文这样宣布投入5000万美金的新势力，反而更值得期待。

问：为什么值得期待？能做成吗？

李涛：所有试图投身AI大模型的中国企业都值得期待。王慧文的价值在于，他在大多数人还在观望时就率先表态。当然，表态只是第一步，最终能交出什么样的产品，还需要观察。

问：有大量资金投入，是否意味着我们离大模型更近了？

李涛：大模型靠的是什么？第一是场景，第二是数据，第三是算法，第四是算力。这不仅仅是砸钱就能解决的。

客观来看，我们的场景很丰富；数据量虽不小，但在全球范围内并无绝对优势；算法则处于割裂状态，缺乏一个开放平台来整合大家的智慧；算力方面，我们正面临高性能芯片的限制，与美国相比仍有差距。

总结起来就是：场景丰富，数据中等，算法分散，算力不足。

问：这些问题该如何解决？

李涛：一方面，中国大量算力掌握在政府和运营商手中，需要政府层面推动算力资源的整合。另一方面，行业也需要推动算法公开。

问：为什么倡导公开算法？

李涛：大模型因涉及商业核心，不公开是合理的。但算法可以公开。只有算法公开，才能汇聚众人的智慧。代码开放意味着有更多人能参与维护和优化，从而快速提升整体水平。这本质上是一种利己行为。OpenAI就很聪明，它做完基础模型后，把接口开放了出来。模型训练需要海量数据和多样场景，这不是关起门来就能完成的。

从另一个角度看，算法公开能激励更多开发者创新，推动行业进步，营造更好的发展氛围。开源利人利己，何乐而不为？

问：如果这些问题得到解决，中国企业有机会吗？

李涛：有机会，但不会一蹴而就。这场AI竞赛的本质，首先是看谁能率先抓住应用场景；其次是数据；第三是国际化能力。只有足够国际化，才能解决算法持续迭代和算力不足的问题。

三、用蒸馏法训练AI大模型，沉淀中小模型

问：APUS今年在AI大模型方面的目标是什么？

李涛：目标非常明确：全面拥抱AI，成为一家人工智能公司。我们预估，转型后公司业绩有望实现200%的增长。

问：成为人工智能公司的标志是什么？

李涛：主要有四个维度：第一，企业内部生产工具和生产效率因AI得到实质性提升；第二，用AI改造现有全部产品；第三，在AI环境下探索全新的产品形态；第四，将AI能力推向全产业链，使其成为新的增长引擎。

问：会与百度“文心一言”这样的大模型公司合作吗？

李涛：合作或许会有，但存在一个关键矛盾：合作沉淀下来的模型资产归属谁？这个关系很难平衡。因此，国内企业都需要考虑沉淀出属于自己的中小模型，这是未来发展的基石。

问：具体应该怎么做？

李涛：方法包括：利用外部大模型进行自我训练；同时，通过“蒸馏法”用领先的大模型（如GPT）来反向训练自己的模型；在关键节点，还需要加入人工干预。

问：APUS在自己训练大模型吗？

李涛：我们自研了一个参数在千亿级别的“天燕”大模型，并由此衍生出无数精炼的中小模型。同时，我们也用GPT等大模型，通过蒸馏法来训练我们自己的模型。

从商业化角度看，我们会针对不同场景部署不同的小模型。每个场景可能对应1到10款不同的产品或软件，以此确保有足够的用户量来持续优化我们的小模型。

问：中小模型和大模型的核心区别是什么？

李涛：区别主要在于参数规模、所需算力和应用场景。大模型与中小模型界限分明，而中小模型之间则比较模糊。大模型能力全面，可以封装出中模型和小模型。未来，独立存在的小模型可能会很少，它们大多会是在大模型训练过程中，针对特定参数和场景衍生出来的。

问：大、中、小模型，哪个会率先爆发或带来更多商业机会？

李涛：毋庸置疑，短期内一定是中小模型。今年下半年，各种中小模型会迅速产生商业价值。但从长远看，潜力最大的依然是大模型。如果说PC时代的引擎是Windows和Linux，移动互联网时代的引擎是安卓和iOS，那么下一个时代的引擎就是人工智能。OpenAI的野心，正是想把GPT打造成下一代操作系统。大家都在争夺这个未来操作系统的定义权和话语权。