对话APUS李涛揭秘AI转型大模型蒸馏训练与中小模型沉淀
走进融新科技中心A座23层,绿植与野营桌椅帐篷构成了一幅轻松的画面。在这里,我们见到了APUS创始人李涛,一身休闲装,神态放松。访谈还没开始,他就用八个字概括了创办APUS的心路——“享受过程、追求快乐”。整个对话中,“快乐”一词被反复提及。令人印象深刻的是,关于创业压力与至暗时刻的抱怨很少,取而代之的,是一种应对行业变局的从容。
据说,APUS选择办公地点时偏爱高层。原因很简单:狭窄的格子间容易带来压迫感,而开阔的视野能让团队心境更宽广。站在他们办公室的窗前,北京的地标建筑“中国尊”清晰可见。
李涛是国内最早一批接触大模型的业内人士。早在2019年,他就与字节跳动创始人张一鸣、红杉中国创始人沈南鹏在硅谷会见了OpenAI创始人Sam Altman。这次会面,为APUS日后全面转向人工智能埋下了伏笔。
2022年11月底,ChatGPT的横空出世引爆了全球关注。随后,谷歌宣布推出Bard,微软则将大型语言模型深度整合进Office套件。国际科技巨头在大模型领域的角逐,至今仍未停歇。
国内市场同样风起云涌。今年2月ChatGPT在国内出圈后,互联网大厂迅速入场。百度率先官宣“文心一言”,阿里、腾讯、360等也相继加入战局。虽然一些厂商尚未推出可商用的产品,但大部分都已将重心转向大模型研发。
在这场全球性的AI竞赛中,APUS的布局显得更早一些。这家成立于2014年的全球化移动互联网公司,以工具产品起家,逐步拓展至内容与服务,目前全球用户已超24亿。面对AI风口,APUS在2019年便开始相关探索,并于去年底正式启动“大AI战略”,比国内这波热潮早了近两个月。
从移动互联网公司转向人工智能,李涛认为这与公司的定位转变密不可分。“2020年以前,我们定位自己是‘中国出海企业’;之后,我们升级为‘全球化公司’。这个定位决定了我们能更早感知到全球技术浪潮的变化。去年底,我们真切感受到了AI带来的竞争压力与巨大潜力,于是决定全面拥抱AI。”
一、“不要抱着补偿心理创业,创业者要享受过程”
问:您如何看待创业这件事?
李涛:创业是一个动态过程,它既不是起点,也不是终点。创业者必然会经历高光与低谷。如果只盯着三五年后的某个成功时刻,那么高光过后,落寞感也会随之而来,这是自然规律。所以,创业者不必为了追求某个特定时刻而苦苦煎熬,更重要的是享受整个过程,从中获得快乐。
问:所以您属于很享受过程的人?
李涛:是的。做事首先要顺势而为,其次要学会造势,最后是享受过程。把这三件事都做到,心态自然会平衡,成功之后也不会有强烈的“补偿心理”——觉得过去太苦了,现在必须加倍索取。
问:要想创业成功,什么特质最重要?
李涛:积极且稳定的心态。市场上有些上市公司并不赚钱,部分原因就在于创始人觉得创业过程太苦,上市后补偿心理过重,这种心态反而会阻碍企业走向真正的成功。相反,那些能持续处在高光期的企业,其领导者往往是在享受创造价值的过程,并非单纯追求某个里程碑。这种积极心态,会带来正向的循环效应。
创办APUS以来,业务增长很快,因为创造了社会价值,我也从中感受到快乐。没有补偿心理的负担,反而更容易做出清醒的判断,让企业保持健康的发展态势。
二、全球化视野提前感知AI变革,决定全面转型
问:APUS如何定位自己?
李涛:我们是一家以产品技术为核心的全球化移动互联网公司。2014到2019年,我们专注于出海业务,定位是“中国出海企业”。2019年战略升级后,我们将自己定位为“全球化公司”,中国、美国或其他市场,都只是我们选择的区域市场之一。
问:决定全面转型人工智能,有什么具体的契机吗?
李涛:ChatGPT的出现,再次暴露了国内互联网全球化程度不足的问题。其实去年10月,ChatGPT就在美国校园火了,但这个概念直到今年2月才在国内形成热潮。这意味着,国内在技术意识的感知上,可能比美国晚了三到四个月。而作为一家全球化企业,APUS的感知模型天然具备全球视野,我们去年就已经接触到ChatGPT并开始了相关研究。
问:APUS最早是如何切入的?
李涛:我们从AIGC入手。但很快发现,ChatGPT所代表的语言模型训练,其挑战远大于AIGC。如今很多所谓的AIGC,其实只能算中等模型,并非真正的大模型。
问:所以像谷歌这样拥有海量数据的公司,在大模型上最有优势?
李涛:未必。这类公司往往面临“自我革命”的难题。搜索引擎建立在归纳法之上,并由此形成了成熟的商业模式。让它们彻底转向演绎法逻辑的大模型,非常困难。谷歌做大模型多少有些被动,因为已经落后,就只能遵循OpenAI制定的规则。即便未来谷歌做出了超越OpenAI的模型,它很可能也会试图将技术拉回自己熟悉的赛道,以发挥原有优势,这反而可能导致再次落后。这是巨头们的普遍痛点。
问:如果中国出现下一个OpenAI,您认为小公司比大公司的机会更大?
李涛:对。目前有能力尝试GPT的,大多是互联网企业,但它们往往有沉重的既得利益包袱,不愿轻易舍弃。因此,像王慧文这样宣布投入5000万美金的新势力,反而更值得期待。
问:为什么值得期待?能做成吗?
李涛:所有试图投身AI大模型的中国企业都值得期待。王慧文的价值在于,他在大多数人还在观望时就率先表态。当然,表态只是第一步,最终能交出什么样的产品,还需要观察。
问:有大量资金投入,是否意味着我们离大模型更近了?
李涛:大模型靠的是什么?第一是场景,第二是数据,第三是算法,第四是算力。这不仅仅是砸钱就能解决的。
客观来看,我们的场景很丰富;数据量虽不小,但在全球范围内并无绝对优势;算法则处于割裂状态,缺乏一个开放平台来整合大家的智慧;算力方面,我们正面临高性能芯片的限制,与美国相比仍有差距。
总结起来就是:场景丰富,数据中等,算法分散,算力不足。
问:这些问题该如何解决?
李涛:一方面,中国大量算力掌握在政府和运营商手中,需要政府层面推动算力资源的整合。另一方面,行业也需要推动算法公开。
问:为什么倡导公开算法?
李涛:大模型因涉及商业核心,不公开是合理的。但算法可以公开。只有算法公开,才能汇聚众人的智慧。代码开放意味着有更多人能参与维护和优化,从而快速提升整体水平。这本质上是一种利己行为。OpenAI就很聪明,它做完基础模型后,把接口开放了出来。模型训练需要海量数据和多样场景,这不是关起门来就能完成的。
从另一个角度看,算法公开能激励更多开发者创新,推动行业进步,营造更好的发展氛围。开源利人利己,何乐而不为?
问:如果这些问题得到解决,中国企业有机会吗?
李涛:有机会,但不会一蹴而就。这场AI竞赛的本质,首先是看谁能率先抓住应用场景;其次是数据;第三是国际化能力。只有足够国际化,才能解决算法持续迭代和算力不足的问题。
三、用蒸馏法训练AI大模型,沉淀中小模型
问:APUS今年在AI大模型方面的目标是什么?
李涛:目标非常明确:全面拥抱AI,成为一家人工智能公司。我们预估,转型后公司业绩有望实现200%的增长。
问:成为人工智能公司的标志是什么?
李涛:主要有四个维度:第一,企业内部生产工具和生产效率因AI得到实质性提升;第二,用AI改造现有全部产品;第三,在AI环境下探索全新的产品形态;第四,将AI能力推向全产业链,使其成为新的增长引擎。
问:会与百度“文心一言”这样的大模型公司合作吗?
李涛:合作或许会有,但存在一个关键矛盾:合作沉淀下来的模型资产归属谁?这个关系很难平衡。因此,国内企业都需要考虑沉淀出属于自己的中小模型,这是未来发展的基石。
问:具体应该怎么做?
李涛:方法包括:利用外部大模型进行自我训练;同时,通过“蒸馏法”用领先的大模型(如GPT)来反向训练自己的模型;在关键节点,还需要加入人工干预。
问:APUS在自己训练大模型吗?
李涛:我们自研了一个参数在千亿级别的“天燕”大模型,并由此衍生出无数精炼的中小模型。同时,我们也用GPT等大模型,通过蒸馏法来训练我们自己的模型。
从商业化角度看,我们会针对不同场景部署不同的小模型。每个场景可能对应1到10款不同的产品或软件,以此确保有足够的用户量来持续优化我们的小模型。
问:中小模型和大模型的核心区别是什么?
李涛:区别主要在于参数规模、所需算力和应用场景。大模型与中小模型界限分明,而中小模型之间则比较模糊。大模型能力全面,可以封装出中模型和小模型。未来,独立存在的小模型可能会很少,它们大多会是在大模型训练过程中,针对特定参数和场景衍生出来的。
问:大、中、小模型,哪个会率先爆发或带来更多商业机会?
李涛:毋庸置疑,短期内一定是中小模型。今年下半年,各种中小模型会迅速产生商业价值。但从长远看,潜力最大的依然是大模型。如果说PC时代的引擎是Windows和Linux,移动互联网时代的引擎是安卓和iOS,那么下一个时代的引擎就是人工智能。OpenAI的野心,正是想把GPT打造成下一代操作系统。大家都在争夺这个未来操作系统的定义权和话语权。
四、ChatGPT不是很热,是还不够热
问:您如何看待ChatGPT?
李涛:ChatGPT做了一件前所未有的事:它利用人类已有的智慧,生成一个历史上从未出现过的全新结果,并将这个结果作为唯一答案呈现出来。这是过去任何机器都无法做到的。
它就像一个拥有7岁孩童智慧的系统,既能模仿,也能创新。好比看了无数画作后,它能自己创作一幅全新的画。
问:目前行业对ChatGPT的接受度如何?
李涛:认知仍然滞后。前段时间我MBA课程有一份关于日本工匠精神的作业,我完全用ChatGPT生成了讲解PPT。第二天展示时,很多同学还对ChatGPT感到惊讶和陌生。
问:APUS内部AI的应用到了什么程度?
李涛:所有内部系统都已接入AI。图片和图标设计完全由AI完成,超过一半的程序员代码都由AI进行审核。
问:如何提升员工使用AI的积极性?
李涛:去年春节后,我们制定了一套奖励机制:要求所有程序员、设计师及一线生产员工必须使用AI提升效率。效率提升30%的,加薪10%;提升50%以上的,加薪20%到30%。用真金白银激励大家拥抱新技术。
问:如果全行业都普及了AI,企业的核心竞争力将体现在哪里?
李涛:核心差异将体现在:谁更早想到使用AI,谁用得更加彻底,谁的生产效率提升得最快。在这场效率革命中,领先一步,潜力就大一分。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
JamGPT AI调试助手功能详解与使用指南
调试,是每位开发者日常工作中最具挑战性的环节之一。面对新的Bug报告,从理解问题、定位代码到寻找解决方案,整个过程往往需要反复排查与试错。如今,一款工具正试图改变这一现状——它能在你开始阅读报告之前,就为你梳理出问题的可能原因和修复思路。这就是由Jam推出的AI调试助手:JamGPT。 JamGPT
SitePoint 社区论坛 程序员与设计师的在线技术交流平台
SitePoint社区论坛是全球开发者与设计师高度认可的专业技术交流平台。该社区致力于为编程新手与进阶开发者提供系统化的学习路径,助力用户高效掌握并提升特定技术栈的实战能力。论坛内容涵盖Web前端与后端开发、UI UX设计、技术文档撰写以及用户体验优化等多个热门领域,资源丰富且专业。网站整体布局直观
Reddit社区特色与用户个性深度解析
Reddit 作为全球知名的社区平台,以其高度细分和活跃的讨论氛围而闻名。在这里,开发者不仅可以主动发起关于前沿技术的话题,更能与全球程序员深入交流编程实战经验、代码调试技巧,以及探讨人工智能、云计算等当前 IT 行业的热点趋势。值得注意的是,编程开发板块是 Reddit 生态中极具专业性的组成部分
讯飞星辰AI开发平台功能详解与实战应用指南
在AI开发工具不断涌现的当下,一个平台能否有效降低技术门槛,同时提供强大的能力支持,是开发者选择的关键。讯飞星辰Agent开发平台精准地回应了这一需求。它不仅仅是一个模型调用接口,更是一个融合了前沿AI技术、全面工具链与灵活部署方案的一站式智能体开发与赋能环境。 什么是讯飞星辰Agent开发平台?
AI生成SEO博客文章自动添加内链与图片
想要高效创作一篇符合搜索引擎优化标准的长篇博客文章?现在有了更智能的解决方案。传统的内容创作流程,包括撰写文稿、寻找配图、优化关键词、布局内链等环节,往往需要投入大量时间和精力。如今,通过先进的AI内容生成工具,这些复杂的步骤可以实现自动化串联,直接输出结构清晰、要素完备且对SEO友好的高质量文章。
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

