谷歌苹果华人高管创业,融资3.5亿推多模态大模型

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
谷歌工作了14年的戴明博,与苹果的杨寅飞共同创立了Elorian。
编译 |万贵霞
编辑 |云鹏
智东西1月14日消息,据美国科技媒体The Information报道,两位科技大厂前AI研究员——谷歌DeepMind前成员戴明博(Andrew Dai)与苹果前研究科学家杨寅飞(Yinfei Yang),联合创立了Elorian公司。该公司专注于开发能够同时理解和处理文本、图像、视频及音频的AI模型。
目前,Elorian正在推进一轮规模达5000万美元(约合人民币3.5亿元)的种子轮融资,Striker Venture Partners有望成为本轮领投方,双方洽谈已进入关键阶段。
戴明博出身于高知家庭,他父亲是机构学和机器人学领域大佬戴建生。作为Elorian的CEO,他之前在谷歌DeepMind任职超14年,负责数据驱动型预训练相关工作。他深耕深度学习领域20年,曾在剑桥大学、爱丁堡大学攻读过学位,是机器学习方向的博士。
Elorian另一位联合创始人杨寅飞,学生时期曾在南京邮电大学Echo实验室,参与差分进化算法参数控制相关研究,毕业作品Apollo3D(阿波罗3D)获苏州机器人世界杯第五名。他还参与癫痫诊断研究,开发MRI图像配准与可视化系统,之后在美国宾夕法尼亚大学攻读硕士学位。
在AI创业从“拼应用”转向“拼底层能力”的背景下,具备长期基础模型研究经验的华人科学家正加速走向创业前台,Elorian成为近期视觉AI赛道中备受关注的案例之一。
01.
前谷歌DeepMind与苹果研究员联合创业
据The Information报道,Elorian公司由戴明博与杨寅飞联合创立。
戴明博与杨寅飞的领英个人资料显示,二人目前就职于一家“隐形(Stealth)”状态的公司,戴明博是该公司的CEO。
业内普遍认为,这家“隐形”公司很可能是Elorian。

▲“隐形(Stealth)”的领英主页资料(图源:领英)
1、戴明博,深耕DeepMind 14年,担任Gemini预训练工作
据戴明博领英个人资料显示,他在谷歌DeepMind工作超过14年,是Gemini数据领域的联合负责人,担任Gemini预训练工作。
此前,戴明博曾参与谷歌SGE的建模工作,在谷歌大脑(Google Brain)从事自然语言处理研究,在谷歌健康(Google Health)从事电子健康记录研究,并参与了Google Now的开发。

▲戴明博(图源:领英)
在领英自我介绍中,戴明博写到自己在深度学习领域拥有丰富经验,研究方向包括自然语言理解和大型语言模型。
戴明博2003-2006年在英国剑桥大学计算机科学专业学习;2007-2012年在爱丁堡大学攻读机器学习博士。
他过去20年来一直从事预训练相关研究。其研究主要集中在开发评估AI模型训练数据质量的技术,并确保模型使用来自各种不同来源的数据进行训练。
据相关报道消息,戴明博出生于高知家庭,他的曾祖父毕业于金陵大学(南京大学前身),爷爷毕业于厦门大学土木工程系。
戴明博的爸爸则是开辟了国际机构学和机器人学研究新领域的大佬、现南方科技大学机器人研究院院长戴建生。

▲戴明博在福建莆田的家庭合照,右下1为戴建生,左上1为戴明博(图源:公众号angrysprite不可言喻)
可能受父亲的耳濡目染,戴明博也攻读机器学习相关专业,从事谷歌DeepMind相关工作,且创立了Elorian公司。
2、杨寅飞,横跨谷歌苹果,主攻视觉和语言多模态模型领域
杨寅飞领英主页资料显示,他于2024年1月加入苹果,担任苹果公司AI机器学习部门的研究科学家。

▲杨寅飞(图源:谷歌杨寅飞主页)
杨寅飞在学生阶段就开始接触行业相关工作。据杨寅飞的谷歌个人介绍,2007年12月至2009年7月,他曾作为研究助理在南京邮电大学Echo实验室进化计算研究组工作,参与设计了一种用于控制差分进化算法参数的新方法。
在本科阶段,杨寅飞完成的毕业作品名为Apollo3D(阿波罗3D),主要用于Robocup足球模拟器中的Simu-Robot动作设计。该作品曾在苏州机器人世界杯比赛中获得第五名。

▲杨寅飞的毕业作品Apollo3D图像演示(图源:Source Forge)
2010年5月至10月,杨寅飞参与了一项跨校、跨国合作研究,与南京航空航天大学的郑刚及田纳西理工大学的 Forrest Sheng Bao合作,围绕AI与脑磁图(MEG)结合的癫痫诊断软件展开研究,目标是验证机器学习方法在癫痫诊断中的可行性。
在具体实现上,他参与开发了一套用于MRI图像配准与可视化的软件系统,并结合基于SAM-kurtosis algorithm(SAM[g2])计算的结果,对来自CTF脑磁图系统的数据进行处理。该项目源码已开源,并发布在Source Forge平台。

▲MRI图像可视化系统CTF-SAM-OUT的图像演示(图源:Source Forge)
2011年5月至2012年5月,杨寅飞担任Longin Jan Latecki教授的研究助理,该教授是美国天普大学(Temple University)计算机与信息科学系的博士生导师。

▲2012年,Longin Jan Latecki教授发表论文《基于足迹检测的跟踪方法,实现对非静态目标物体的导航》,杨寅飞担任二作(图源:天普大学主页)
2012年至2013年,杨寅飞在美国宾夕法尼亚大学攻读硕士学位,研究方向包括计算机视觉、机器人学和自然语言处理。
2013-2017年期间,他先后在亚马逊和Redfin担任研究工程师,负责机器学习和计算机视觉领域的研究。
之后,他在谷歌任职超4年,从事自然语言处理的研究,包括语义检索(semantic retrieval)、多语言表示(multilingual representation)和多模态表示(multimodal representation)等。
2024年,杨寅飞担任苹果公司AI机器学习部门的研究科学家,主要研究视觉和语言基础模型。
他于去年12月离开苹果,与戴明博一起筹划创立Elorian。
02.
Elorian能同时理解图像、视频和音频,
计划融资3.5亿元
戴明博在The Information的电话采访中说,Elorian专注于构建能够通过同时处理图像、视频和音频来对物理世界进行视觉解读和分析的AI模型。
戴明博还说,虽然机器人技术是Elorian的一个潜在应用领域,但这家初创公司设想了许多其他应用,不过他并未详细说明。杨寅飞尚未对此置评。
视觉推理模型因具备多模态功能整合能力,专为机器人系统等复杂AI应用场景设计,从而节省开发人员拼接不同AI模型的工作量。
一些研究人员向外媒解释道,这项技术对于需要解读和理解图像以执行高级任务的AI智能体来说非常有价值。
在融资方面,外媒据戴明博和另一位知情人士透露,初创公司Elorian正在与投资者洽谈,计划进行约5000万美元(约合人民币3.5亿元)的种子轮融资。
该知情人士还说,由风投公司CRV前普通合伙人Max Gazor于去年10月创立的风险投资公司Striker Venture Partners正在洽谈领投此轮融资。
03.
结语:视觉推理AI成为巨头与创企关注焦点
从最早仅处理文本的大模型,到如今同时理解图像、视频与音频的多模态系统。这一被称为视觉推理的研究领域,如今已成为包括谷歌、OpenAI和Anthropic在内的众多大型AI提供商和初创公司的关注焦点。
Elorian的出现,正是这一浪潮中的缩影,其能否在视觉推理这一关键赛道中跑出差异化路径,仍有待时间验证。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
我把 Anthropic 的 Harness 工程思想做成了一个 Skill
用AI写代码,难在哪儿? 用AI生成代码本身并不难,真正的挑战在于让它稳定地交付一个真正可用的东西。这篇文章,我们就来聊聊Anthropic工程团队是如何破解这个难题的,以及我如何将这套方法论落地成了一个可以复用的实战工具。 用 AI 写代码有多难?不是写不出来难,是让它稳定交付可用的东西很难。这篇
沃尔玛、塔吉特等美国零售巨头拥抱 AI,明确用户需为购物助手出错担责
美国零售巨头拥抱AI新玩法:功能归我,风险归你? 最近有件事挺有意思,美国那边的大型零售商们,正铆足了劲把AI往购物流程里塞。但你猜怎么着?一旦AI捅了娄子,买单的却很可能变成了消费者自己。 这不,就在当地时间4月5号,外媒Futurism的一篇报道就点破了这个现象。企业们一边热火朝天地推广AI功能
小米物流大件“当日达”服务上线 50 城
小米物流大家电“当日达”实现全国50城覆盖,上午11点前下单最快当日送达 对于大家电配送时效长的普遍困扰,小米物流带来了全新的解决方案。最新消息显示,小米旗下大件商品的“当日达”服务范围已成功拓展至全国50座重点城市。除了北京、上海、广州、深圳、杭州、成都等一线与新一线核心城市外,此次升级还囊括了天
为什么现在很多人觉得 OpenClaw 不好用
当前开源版本的定位 你得明白,当前的开源版本,本质上更偏向于一个**开发者工具链**,而非一个即开即用的完整产品。它的核心组件非常明确: 一个基于 Node js 的运行环境 (runtime) 一个网关 (gateway) 插件与技能 (plugins skills) JSON 配置文件 命令
WorkBuddy工具
好的,我已准备好作为您专属的 SEO 内容优化专家开始工作。我将严格遵循您的所有指令,在不触碰任何 HTML 标签、属性及图片代码的前提下,专注于对纯文本内容进行深度优化与重写,以提升其在搜索引擎中的可见性与吸引力。 我的核心工作流程是:首先,我会精准解析您提供的原始文章,确保核心事实与信息结构毫发
- 日榜
- 周榜
- 月榜
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程

