当前位置: 首页
科技数码
LMArena最新估值170亿美元,为AI大模型提供权威评测半年涨三倍

LMArena最新估值170亿美元,为AI大模型提供权威评测半年涨三倍

热心网友 时间:2026-01-08
转载

随着人工智能行业的竞争日益激烈,一家专注于大模型性能评估与排名的初创公司LM正在快速崛起,逐渐成为推动行业发展的关键基础设施。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

根据公司披露的最新信息,LM已完成新一轮1.5亿美元的融资,投后估值达到17亿美元。这一数字较2025年5月宣布种子轮融资时的估值增长了近三倍,凸显出市场对独立第三方AI评估平台的迫切需求。

本轮融资由现有投资者Felicis和加州大学投资部门共同领投。所筹资金将主要用于支付算力成本,以支持其为OpenAI、Google、xAI和Microsoft等客户评估AI模型,同时用于扩充技术团队。作为行业内被广泛引用的基准,LM通过“背靠背”比较的方式,利用数百万用户的反馈生成模型排名,直接影响着各大科技巨头在AI领域的声誉与竞争格局。

LM首席执行官兼联合创始人Anastasios Angelopoulos指出,顶尖的实验室正在使用该平台,因为它们面临着难以客观评估自身模型优劣的挑战。这种评估机制不仅帮助开发者在公开发布前获得早期反馈,也已成为AI模型开发商对外宣传其技术实力的核心依据。随着AI模型间的性能差异日益缩小,LM的排行榜已成为衡量行业技术进步的重要标尺。

尽管LM依靠无偿互联网用户反馈的模式引发了部分关于数据准确性和专业性的争议,但这并未阻碍其商业化进程的加速。公司披露,上个月其“年化消费运行率”已达到3000万美元,表明其基于客户使用量的收入潜力正在快速释放。

独特的评估机制与行业影响力

LM的核心竞争力在于其独特的众包评估模式。该公司邀请全球互联网用户提问或使用模型进行图像等内容创作。用户在不知晓模型具体名称的情况下,从两个选项中挑选出最佳答案,随后系统才会揭晓生成该输出的模型身份。LM将这些结果汇总成不同类别的排行榜,涵盖AI编程、图像及视频生成等多个领域。

这种机制使得LM成为了AI行业的“竞技场”。甚至在模型正式向公众发布前,该初创公司有时也会托管这些模型,为开发公司提供早期的市场反馈渠道。随着各家AI模型的性能差距逐渐缩小,开发商们越来越依赖LM的排名来证明其技术优势。Anastasios Angelopoulos强调,对于那些试图在激烈的市场竞争中确立地位的实验室而言,这种外部验证至关重要。

商业化进展与用户规模

在财务表现方面,LM展现出强劲的增长势头。尽管公司未透露最近具体的营收增速,但在去年9月,其年化收入规模已达数百万美元。而根据其对上月客户使用量的推算,目前的年化消费运行率已激增至3000万美元。

用户基础方面,LM表示目前在150个国家拥有超过500万月度用户。这一数字既包括访问查看排名的访客,也可能包括实际参与模型评分的用户。这一庞大的用户群构成了LM数据护城河的基础,为其排名的广泛性和实时性提供了支撑。

面临的争议与竞争挑战

尽管增长迅速,LM的模式并非没有争议。

一些模型制造商批评称,依靠无偿的互联网用户进行反馈存在缺陷,可能面临被刷榜的风险,且无法反映专家的深度意见。

这一批评指出了大众评审与专业评审之间的张力。相比之下,Scale AI等竞争对手采取了截然不同的路径,通过聘请律师或教授等专家为模型提供付费反馈,以强调评估的专业性和严谨性。LM未来如何在保持规模效应的同时提升评估的权威性,将是其持续获得市场信任的关键。

来源:https://www.163.com/dy/article/KIMVN0TE05198NMR.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
Redmi G Pro 32U显示器深度评测:千级分区背光与双系统全场景体验

Redmi G Pro 32U显示器深度评测:千级分区背光与双系统全场景体验

今年,游戏圈注定热闹非凡。多款现象级3A大作扎堆登场,玩家对桌面显示设备的需求,显然又站上了一个新台阶。早已不满足于“高刷、高画质”的单一维度,大家追求的是更深度的沉浸感和更全能的场景覆盖。 在这样的背景下,Redmi推出了其首款31 5英寸4K级别显示器——G Pro 32U。它绝非简单的尺寸放大

时间:2026-05-13 19:00
微星神影16 Max游戏本新配置开售 12799元起入手

微星神影16 Max游戏本新配置开售 12799元起入手

微星神影16Max游戏本新增两款配置,搭载英特尔酷睿Ultra9处理器与RTX5060 5070显卡,配备16英寸2 5K240Hz高色域屏及高效散热系统,整机性能释放达200W,起售价12799元。

时间:2026-05-13 18:59
比亚迪拟接手欧洲闲置工厂以扩大汽车产能

比亚迪拟接手欧洲闲置工厂以扩大汽车产能

比亚迪正与Stellantis等欧洲车企洽谈,计划接手意大利等地闲置工厂,以推动电动车本地化生产。此举旨在快速激活产能、缩短供应周期,并倾向于独立运营保持自主可控。同时,比亚迪招募人才助力高端品牌腾势拓展欧洲市场,以规避贸易壁垒、降低成本,实现从出口向本地深耕的战略转型。

时间:2026-05-13 18:59
腾讯一季度营收增长9% 马化腾称AI产品获重大突破

腾讯一季度营收增长9% 马化腾称AI产品获重大突破

腾讯一季度营收1964 6亿元,同比增长9%。游戏与广告业务表现稳健,其中广告收入增长20%。AI战略取得显著进展,Hy3preview模型性能领先且调用量大幅增长,相关智能体服务已规模化落地。研发投入持续增加,微信生态内AI应用不断丰富,月活用户稳步上升至14 32亿。

时间:2026-05-13 18:59
曙光发布FlashNexus 9000全闪存存储性能突破2亿IOPS

曙光发布FlashNexus 9000全闪存存储性能突破2亿IOPS

中科曙光发布新一代全闪存存储系统FlashNexus9000,性能达2亿IOPS,时延低至0 09毫秒。系统可靠性高达99 99999%,核心硬件与软件栈实现100%国产化。在金融、医疗、电信等行业应用中,该系统显著提升了交易处理速度、系统响应效率和业务结算效率。

时间:2026-05-13 18:58
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程