面包屑图标 当前位置: 首页
AI资讯
热点详情

Meta脑机接口重大进展登Nature子刊实现高实时解码准确率

AI热点日报
AI热点日报时间:2026-07-03
热点解读

脑机接口领域近期似乎进入了相对平静的阶段,但一项最新的突破打破了这一沉寂。 提到脑机接口,大多数人第一时间想到的可能是马斯克的Neuralink。不过,这里需要先明确:脑机接口实际上存在两条技术路径——侵入式与非侵入式。简单来说,侵入式需要开颅手术植入电极,而非侵入式则完全无需手术。 侵入式路线最典

脑机接口领域近期似乎进入了相对平静的阶段,但一项最新的突破打破了这一沉寂。

提到脑机接口,大多数人第一时间想到的可能是马斯克的Neuralink。不过,这里需要先明确:脑机接口实际上存在两条技术路径——侵入式与非侵入式。简单来说,侵入式需要开颅手术植入电极,而非侵入式则完全无需手术。

侵入式路线最典型的代表就是Neuralink。它直接将微电极阵列插入大脑皮层,能够获取极高的信号质量,解码准确率已超过90%。到2025至2026年,已有数位瘫痪患者成功植入设备,实现用意念操控电脑。今年3月,国内也有侵入式脑机接口产品获得上市批准。但代价显而易见——手术本身即为门槛,能接受的人群非常有限。

非侵入式路线则温和许多,仅需通过头皮外部的传感器采集大脑活动,无需开刀。安全性高,理论上可大规模推广。然而,问题在于信号穿过颅骨和脑脊液后衰减严重,空间分辨率远不如皮层内的电极。由于采集到的信号存在“先天不足”,解码能力一直较弱,目前仍基本处于难以实用的状态。

但这一次,Meta实现了非侵入式脑–文本解码器研究的重大突破:Brain2Qwerty v2

顺便一提,Meta去年发布的Brain2Qwerty v1版本,当时就登上了Nature Neuroscience

登上Nature子刊!Meta脑机接口重大阶段性进展,超高实时解码准确率

论文链接(v1):https://www.nature.com/articles/s41593-026-02303-2

Brain2Qwerty v2是目前性能最高的端到端流程,能够从原始脑信号中实时解码句子。它已超越字符级解码层面,可以直接解码单词和语义,从而极大提升整体沟通的准确性。

v1在2025年发布时,核心能力是从MEG脑磁信号中逐字解码打字内容,最佳成绩的字符错误率(CER)约32%。

v2则改变了解码的粒度。它不再一个字一个字地拼凑,而是一步到位输出完整句子。根据Meta公布的数据,9名被试的平均单词准确率达到61%,表现最好的被试达到了78%,其中超过一半的句子解码偏差控制在一个单词以内

论文链接(v2):https://ai.meta.com/research/publications/accurate-decoding-of-natural-sentences-from-non-invasive-brain-recordings/

技术架构

Meta研究团队此次发布的Brain2Qwerty v2,是目前性能最高的端到端非侵入式脑信号解码系统。它能够从连续的脑活动中实时解码完整句子,准确率已接近此前只有依赖开颅植入脑机接口才能达到的水平。

为加速神经科学研究,团队已将Brain2Qwerty v1和v2的全部训练代码开源。同时,合作方——西班牙巴斯克认知、大脑与语言中心(BCBL)——也同步开放了v1的数据集。

开源链接:https://github.com/facebookresearch/brain2qwerty

数据集链接:https://huggingface.co/datasets/bcbl190626/SpanishBCBL

博客链接:https://ai.meta.com/blog/brain2qwerty-brain-ai-human-communication/

可以确定的是,这项研究有望真正改善数百万因脑损伤而失去交流能力患者的生活。此前,立体定向脑电图(Stereo-EEG,SEEG)和皮层脑电图(ECoG)等侵入式技术已证明,通过神经假体采集脑信号并结合AI解码,能恢复患者语言交流能力。然而,这类方案需要脑部手术,难以大规模推广。相比之下,非侵入式方案恰恰有望填补这一空白。

在Brain2Qwerty v2的训练中,研究团队收集了9名志愿者约22,000句话的输入数据。每位参与者佩戴脑磁图(MEG)设备,在主动键盘输入过程中连续记录了大约10小时的脑活动。

与传统依赖人工设计神经事件检测流程的方法不同,Brain2Qwerty v2采用端到端深度学习框架,直接从原始脑信号中学习并完成文本解码。

Brain2Qwerty v1的核心思路是:根据在BCBL采集的MEG脑活动模式预测键盘敲击(keystrokes)。但这一方法存在关键限制——它依赖每一次按键的精确时间,因而无法实现实时解码。Brain2Qwerty v2突破了这一限制,可以直接从连续的脑活动信号中生成完整句子。

新模型由三个层级模块构成,协同提升对“字母—单词—句子”的解码能力:

  • MEG信号首先输入Conformer模块(用于字符级检测)
  • 随后进入Aligner(用于构建词级嵌入)
  • 最后由大语言模型(LLM)重建完整句子

整条流水线分为Brain Encoder和NeuroLLM两块。

Brain Encoder:负责将原始MEG波形压缩为字符级神经特征序列。底层用BrainModule做空间通道融合(Fourier编码传感器坐标 → learnable映射到270个虚拟通道 → per-subject affine补偿个体差异),中层用4层扩张卷积(hidden 1,500)提取特征并做4倍时间下采样,顶层用4层Conformer(dim 1,024,4 heads)建模长程时序依赖。整体以CTC loss做字符级监督,在下采样后和Conformer后各挂一个CTC head联合训练,确保浅层也能获得有效梯度。

研究团队还专门将大语言模型针对神经数据进行了微调,使模型能够利用语言的语义上下文,在噪声较大的脑信号与连贯自然语言之间建立联系,从而显著提升解码质量。

NeuroLLM:在Encoder输出之上接入Qwen3-4B(LoRA rank 128),将神经特征转化为自然语言句子。连接方式是:用CTC输出中的空格位置将Conformer特征切分为词级片段,各自mean-pool后过MLP得到「神经词嵌入」;训练时用SigLIP对比损失(Hard DTW对齐 + sigmoid BCE)将其拉向LLM词嵌入空间。推理时LLM同时接收CTC解码文本和MEG嵌入两路输入(训练中对两路各做10%随机置零,增强鲁棒性),beam search(beam 16)生成最终句子。

此外,研究人员还引入了AI Agent,对整个解码流程进行自动探索和优化;最终采用的训练配置,则是由工程师人工筛选和确认的。

超参数搜索由3个独立的AI coding agent(Cursor + Claude Opus 4.6驱动)并发执行。每个agent分配一个git worktree,可以读写代码和提交SLURM训练任务。每agent跑10轮,每轮正好50个训练job,总计1,500次实验。agent之间严格隔离,只能看到自己分支的结果。工程师从三个agent的最终配置中手动选择最优的一个。

最终结果显示,Brain2Qwerty v2已经能够从高度噪声的脑信号中恢复出语义连贯的完整句子。

模型平均单词准确率达到61%,相比此前其他非侵入式脑信号解码方法约8%的单词准确率,实现了大幅提升。对于表现最佳的一位参与者,单词准确率更是达到了78%;其中超过一半的句子在解码时仅出现1个单词或更少的错误。

仍有挑战

在真正应用到临床之前,这个方案还面临两个主要挑战:

1. 解码精度仍不足以支持日常使用:当前模型依然存在不少单词级或字符级错误,很难直接用于实际沟通场景。

研究团队还发现,模型的解码准确率会随着训练数据规模增加而呈近似对数线性(log-linear)增长。换句话说,目前与侵入式脑机接口之间的性能差距,未来或许仅仅通过持续扩大训练数据规模就能进一步缩小,而不需要依赖新的模型架构。

2. 设备限制比较大:本研究使用的MEG系统体积庞大、成本高昂,普通患者很难接触到。

当前实验用的MEG设备,体积能占满一整间屋子,依赖SQUID和液氦冷却,运行环境还得做磁屏蔽。这套系统造价几百万美元,离床旁使用都还有距离,更别谈日常佩戴了。新一代基于OPM的便携MEG正在研发中,有望把尺寸压缩到头盔级别,不过目前还处在早期阶段。

团队表示,希望通过开放研究的方式,加快人类对神经系统疾病的识别、诊断与治疗,让神经科学的发展速度不再受限于各自封闭的研究体系。

热点追踪提示词
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:Meta脑机接口重大进展登Nature子刊实现高实时解码准确率要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
来源:https://www.jiqizhixin.com/api/article_library/articles/2026-06-30-9
Meta

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关热点
AI热点2026-07-03 20:21
Transkriptor AI驱动语音转文字浏览器扩展

当谈到AI语音转文字工具时,浏览器扩展往往是最轻量且实用的选择。Transkriptor 就是这样一款基于AI技术的Chrome扩展,其主打优势明确:高效、安全,并且兼容几乎所有常见的音频格式。无论是会议录音、采访片段,还是课后讲座,它都能快速转化为文字——同时还能生成字幕、自动汇总会议纪要,甚至支

AI热点2026-07-03 20:21
AnyToSpeech在线文字转语音转换器

AnyToSpeech是一款在线文字转语音工具,支持将文本、PDF、DOCX及网页链接转换为自然听感的音频,提供多种声音和风格选项,可在浏览器在线播放或下载为MP3文件,操作简便无需安装软件。

AI热点2026-07-03 20:20
text-speech.net免费在线文本转语音转换器

免费在线文本转语音工具,无需注册登录即可直接使用。支持多种语言和男女声选择,语速可自由调节,操作界面简洁直观。兼容电脑与手机浏览器,能将文字实时转换为自然流畅的语音,满足朗读、学习等需求。

AI热点2026-07-03 20:20
免费开源Kokoro Web在线AI语音生成器

KokoroWeb是一款免费开源的在线AI语音生成器,支持自托管部署并兼容OpenAIAPI。能将文字转为自然语音,支持多种语言、口音和声音,可调节语速、插入停顿,使用简单且扩展性强,适合开发者和普通用户。

延伸阅读