AI公司如何实现估值170亿:独角兽成长路径深度解析
听闻此乐,源自奥菲斯
量子位 | 公众号 QbitAI
人工智慧模型竟技平台LMArena宣布成功获得1.5亿美元A轮融资。
平台估值一举跃升至170亿美元,这份新年贺礼可谓分量十足!

本轮融资由Felicis和加州大学投资管理公司UC Investments领投,Andreessen Horowitz、The House Fund等知名机构跟投。
资本市场用真金白银投票,足以见得在AI大模型时代,评估平台这条赛道多么炙手可热~
而这家成员99%为华人、核心团队均为90后的明星企业,其走红之路还得从2024年ChatGPT横空出世说起。
从学术探索到商业崛起
LMArena的前身,是曾经在AI圈掀起热潮的Chatbot Arena,最初由非营利开源组织LMSYS创建。
该组织的核心成员均来自加州大学伯克利分校、斯坦福大学、加州大学圣地亚哥分校(UCSD)、卡内基梅隆大学(CMU)等顶尖高校的学术精英。
他们主导的开源推理引擎项目SGLang,在业内首次实现在96张H100 GPU上,跑出了与DeepSeek最新报告吞吐量性能媲美的开源方案。
目前SGLang已实现大规模部署,被xAI、英伟达、AMD、谷歌云、甲骨文云、阿里云、美团、腾讯云等众多知名企业和机构采用。
不过,比起硬核技术,他们最主要也更为出圈的工作,却是对大模型进行评估。
在ChatGPT、Claude一众模型刚刚面世之际,他们率先创办了Chatbot Arena这样一个第三方众包基准测评平台。
LMSYS创始人之一、也是SGLang主导者郑恺,曾向我们透露,当时之所以创建Chatbot Arena,是因为他们自己训练了开源模型小羊驼Vicuna。

当时他们觉得自己的模型还不错,但市面上已有的各种基准测试很难真正区分出模型是“真好”还是“假好”。
团队认为,评估模型最好的方式就是将其放到网上,让用户试用并投票。于是他们便搭建了众包测试平台Chatbot Arena,通过实际的用户交互来评估模型性能。
结果没想到的是,后来Chatbot Arena已独立成为一家公司,而小羊驼Vicuna等大模型的研发却已停滞。

早期的Chatbot Arena采用双盲测试模式,让用户在不了解模型身份的情况下盲选出更优的答案,这种模式吸引了大量AI爱好者前来打卡。
后来,全球各地一有新模型更新都会在里面偷偷测一把,Chatbot Arena逐渐成为模型测评首选排行榜。
这样的影响力让Chatbot Arena在AI领域崭露头角,获得了资本市场的认可。
它独立出来成为一家商业公司lmarena.ai,专注于AI模型评估。
2025年5月,被曝获得种子轮1亿美元投资,估值达60亿美元。
动态竞技场
lmarena.ai的主要项目,就是如今全球大模型的动态竞技场LMArena。

核心评估规则围绕匿名对战、Elo式评分和人机协同框架展开,方式也比较有意思。
用户只要输入问题,系统就会随机匹配两个模型来做匿名回答。
这时候大家不用管模型是谁,只需要根据回答的好坏投票选出更优的那个,系统在投完票之后才会揭晓模型的真实身份。
在评分上,平台基于Bradley–Terry模型设计了Elo评分机制,每个模型都有初始分数,赢了就加分,输了就扣分,随着对战次数越来越多,分数会慢慢稳定下来,最终形成实时更新的排行榜。
除此之外,平台还采用了人机协同的评估模式,用人类的真实投票来反映大家对模型的偏好,再通过算法去平衡各个模型的出场次数、任务类型和样本分布,避免有的模型因为曝光多就被高估,或者因为曝光少就被低估,确保整个评估过程公平客观。
就这样,LMArena成了各家新模型“出道”时的必测榜单。当前Gemini 3 Pro以1490分位居榜首。

自去年拿到1亿美元种子轮融资后,LMArena的发展迅速超出预期。
在短时间内不仅累计了覆盖文本、视觉、网络开发等跨模态的5000万张投票,完成了400余种开放及专有模型的评估,还产出了覆盖文本、多模态、专家及职业等多个类别的14.5万个开源战斗数据点。
现在,LMArena计划将新筹集到的资金用于平台运营,确保平台稳定且高效运行,提升用户体验。同时扩大技术团队,为平台发展注入更多专业技术力量。
参考链接:https://news.lmarena.ai/series-a/
— 完 —
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
嫦娥七号任务下半年择机发射 各项工作按计划推进
我国正体系化整合月球探测任务,将载人登月与无人探月统一纳入“月球探测工程”。嫦娥七号计划下半年发射,将对月球南极开展“绕、落、巡、飞跃”立体探测并推动国际合作。同时,载人航天工程将有序推进长征十号火箭、梦舟飞船及揽月着陆器等关键任务,为载人登月奠定基础。
神舟二十三号发射任务准备就绪即将升空
神舟二十三号已具备发射条件,将采用自主快速交会对接模式,与天和核心舱径向端口对接。届时中国空间站将形成“三船三舱”组合体,为后续复杂在轨任务奠定基础,标志着我国空间站建设进入新阶段。
AI短剧日产千部背后:行业两极分化现状解析
2026年短剧行业因AI技术发生系统性重构。AI生成内容占比超95%,制作成本骤降超90%,导致产能暴增与内容同质化。行业呈现两极分化:传统岗位价值萎缩,而创意、分发端及AI人才价值凸显。出海市场迅猛增长,商业模式全球复制,但面临合规与文化适配挑战。当生产不再稀缺,创意与叙事吸引力成为核心价值。
嫦娥七号任务计划下半年择机发射 各项工作有序推进
嫦娥七号任务各项工作正按计划有序推进,计划于今年下半年择机发射。目前探测器系统、运载火箭系统、发射场系统等各项准备工作正稳步开展,任务团队正全力确保发射任务圆满成功。
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

