汤臣核心刘宇再创业：10个月估值超13.2亿，红杉IDG押注多模态AI

AI热点日报时间：2025-12-02

热点解读

如果不是深入挖掘学术与产业动态，很多人或许仍不知晓：前商汤科技执行研究总监、AIGC产品“秒画”的核心推动者刘宇，已悄然带领新公司完成多轮融资，最新估值突破13 2亿美元。这一消息并非通过高调的融资

尽管行业关注度持续攀升，很多人可能仍未注意到一个关键动态：前商汤科技研究总监、现象级AIGC产品"秒画"的核心研发者刘宇，已悄然带领新公司完成多轮融资，最新估值突破13.2亿美元。这一消息并非来自高调的融资公告，而是隐于其个人主页的更新轨迹：2025年1月创立的专注"实时交互多模态内容"的AI初创企业；2月完成种子轮融资，由红杉中国与IDG资本联合领投；8月Pre-A轮估值超4亿美元；11月A轮估值跃升至13.2亿美元。仅用一年时间，这家初创企业便跻身全球视频模型创业公司第一梯队，与Runway（30亿美元）、Luma（40亿美元）、Pika Labs（数亿美元）等头部玩家同台竞技。

更引人瞩目的是，虽然估值已达13.2亿美元，这家公司却始终未正式公布名称，其核心产品也未公开亮相。不过业内人士通过蛛丝马迹推测，刘宇的创业项目极有可能是Vivix AI。Vivix明确描述的技术方向——聚焦"内容实时互动"与"下一代视觉生成引擎"，与刘宇个人主页中的愿景高度契合。进一步追溯公开信息，Vivix Group Limited注册于香港，控股杭州、上海两家名为"维悦时刻科技"的企业，其法人代表余锋伟与宋广录均曾在商汤任职，而刘宇本人也长期担任商汤研究执行总监。这种"老同事再聚首"的创业组合，让市场推测更具可信度。今年刘宇在ICML、CVPR等顶会发表的多篇论文中，余锋伟与宋广录均位列合作者名单，公司对估值的官方表述也与刘宇个人主页一致，多重线索相互印证。

刘宇在学术与产业领域的履历堪称"教科书级别"。他在香港中文大学MMLab完成博士训练，师从王晓刚教授，早期研究聚焦图像识别、检测与多视角三维理解，曾在ImageNet、MOT等国际竞赛中斩获冠军。加入商汤后，他担任执行研究总监，带领近百人团队开发大规模AIGC与多模态交互模型，掌管超过4000张GPU的算力资源。其主导的"秒画"产品上线9天用户数突破300万，日活超53万，成为早期"AI绘图+内容社区"模式的标杆案例。这段经历赋予他双重优势：既具备"数千卡算力+千万级用户"的实战经验，又完成了从"识别"到"生成+多模态+长时序"的技术转型，为视频模型创业埋下伏笔。

从融资节奏看，这家初创企业的成长速度堪称"极致"。2025年1月成立后，2月即锁定红杉中国与IDG资本的种子轮投资；8月Pre-A轮估值突破4亿美元；11月A轮估值达13.2亿美元。这一速度在全球AI视频赛道亦属罕见：Runway在2025年4月完成3.08亿美元D轮融资后估值达30亿美元；Luma AI同年底融资9亿美元后估值升至40亿美元；Pika Labs在2024-2025年间多轮融资后估值徘徊于4.7亿至7亿美元区间。相比之下，刘宇的新公司在产品未全面公开、品牌知名度有限的情况下，已跻身估值中上部，资本押注的逻辑值得深究。

刘宇对公司方向的描述仅有一句话："致力于实时交互式多模态内容"，但结合Vivix的技术路线与他的研究轨迹，可勾勒出更清晰的图景。传统互联网以"信息流"为核心，内容被预制、编辑后单向推送，用户被动接收。Vivix则判断，下一代互联网的底层界面将是"交互式生成AI"：用户与系统实时互动，系统通过视觉、听觉、文字、动作等多模态输入即时生成个性化内容，创作过程变为持续流动的互动。这一愿景的核心挑战在于"实时性"——当前最强视频生成模型虽质量惊人，但推理速度慢、成本高，难以支撑交互场景。Vivix的解决方案涉及三方面：其一，通过自适应低精度计算动态调整位宽，在精度与效率间取得平衡，降低计算、内存与通信成本；其二，开发基于深度学习编译器的推理引擎，自动优化算子切分与计算图融合，提升硬件利用率；其三，设计混合多维并行策略，针对视频的时间、空间、通道与模态维度拆分组和，适配异构GPU环境。这些技术创新使推理速度提升两个数量级，实现"0.6秒生成T秒画面"的突破。

在速度与成本问题解决后，Vivix将矛头指向"以语言为中心的智能范式"。当前主流大模型以"预测下一个token"为目标，本质是统计模仿，难以理解思想本质；训练数据经语言过滤后存在偏差，模型学到的世界是"语言回响"的缩影；多模态系统虽能处理图像、视频，但常将信息路由回语言通道，导致信息损失与认知偏差。Vivix的解决方案是构建原生多模态系统：视觉、听觉与动态画面作为"一等公民"在统一标记空间交互，语言仅是通路之一，而非"总路由"。这一设计旨在让AI直接跨模态感知世界，形成非语言中心的内部表征，从而更贴近现实、更具自主性。

这家估值13.2亿美元的初创企业之所以引发行业关注，不仅因其融资速度，更因其选择了一条"反向道路"：在视频模型竞争白热化的阶段，不追求更精美的生成效果或更高参数量，而是试图将视频转化为实时交互语言，重新定义互联网界面为"AI原生、实时、多模态"形态。尽管团队规模不足20人，却覆盖模型、系统、编译器与产品体验全栈，技术野心可见一斑。目前，其核心产品尚未亮相，市场考验尚未开始，但若赌对方向，或将推动视频从被动内容形态升级为人与AI协同创造的实时界面。资本押注的是可能性，行业关注的是变量，而答案终将由产品揭晓——它是技术炫技的短暂火花，还是互联网交互新范式的开端？这道题，答案不远。

热点追踪提示词

你是一名 AI 行业编辑，请围绕下面这条热点输出一份资讯解读：
热点：汤臣核心刘宇再创业：10个月估值超13.2亿，红杉IDG押注多模态AI要求：
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题

来源：https://www.itbear.com.cn/html/2025-12/1035626.html

上一篇：孙正义首次坦言清仓英伟达：含泪抛售为加速AI领域投资布局

下一篇：豆包助手AI技术预览版亮相：深度融合手机开启新交互

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

延伸阅读

iPhone 17系列液态硅胶壳曝光：8色可选+挂绳孔设计 iOS 26整合ChatGPT-5：AI全面赋能苹果智能生态真我828真粉节揭晓：10000mAh超大电池手机即将亮相？苹果折叠iPhone曝光：搭载自研C2基带芯片与Touch ID指纹识别对话元戎启行周光：VLA模型核心成本在AI芯片，辅助驾驶方案交付近10万套刘志强：京东方坚持开放合作，拒绝低质低价竞争 Redmi K90系列全系标配5000万长焦与3D超声波指纹，配置再升级 vivo X300系列曝光：天玑9500+2亿像素主摄，长焦微距实力升级

日榜
周榜
月榜

01 / 08-26iPhone 17系列液态硅胶壳曝光：8色可选+挂绳孔设计 02 / 08-26iOS 26整合ChatGPT-5：AI全面赋能苹果智能生态 03 / 08-26真我828真粉节揭晓：10000mAh超大电池手机即将亮相？ 04 / 08-26苹果折叠iPhone曝光：搭载自研C2基带芯片与Touch ID指纹识别 05 / 08-27对话元戎启行周光：VLA模型核心成本在AI芯片，辅助驾驶方案交付近10万套

01 / 本周Huddlenow Insights 谷歌Meet商业企业视频会议服务全方位深度解析 02 / 本周一款实用的YouTube视频高亮标注Chrome浏览器扩展插件 03 / 本周WhisperNotes智能音频笔记应用 04 / 本周Sharpen AI：Chrome扩展秒转Google Meet为笔记邮件任务 05 / 本周字节将河马爱学并入豆包构筑AI产品全家桶

01 / 本月Huddlenow Insights 谷歌Meet商业企业视频会议服务全方位深度解析 02 / 本月一款实用的YouTube视频高亮标注Chrome浏览器扩展插件 03 / 本月WhisperNotes智能音频笔记应用 04 / 本月Sharpen AI：Chrome扩展秒转Google Meet为笔记邮件任务 05 / 本月字节将河马爱学并入豆包构筑AI产品全家桶

热点快看

07-02 14:27Huddlenow Insights 谷歌Meet商业企业视频会议服务全方位深度解析 07-02 14:27一款实用的YouTube视频高亮标注Chrome浏览器扩展插件 07-02 14:27WhisperNotes智能音频笔记应用 07-02 14:27Sharpen AI：Chrome扩展秒转Google Meet为笔记邮件任务 07-02 14:26字节将河马爱学并入豆包构筑AI产品全家桶

热点追踪

持续追踪iPhone 17系列液态硅胶壳曝光：8色可选+挂绳孔设计 持续追踪iOS 26整合ChatGPT-5：AI全面赋能苹果智能生态 持续追踪真我828真粉节揭晓：10000mAh超大电池手机即将亮相？ 持续追踪苹果折叠iPhone曝光：搭载自研C2基带芯片与Touch ID指纹识别