当前位置: 首页
AI
Nature顶刊论文综述神器:高效精准撰写指南

Nature顶刊论文综述神器:高效精准撰写指南

热心网友 时间:2026-02-10
转载

闻乐 发自 凹非寺
量子位 | 公众号 QbitAI

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

AI写论文这事儿确实不新鲜了,但天下苦假引用久矣。

以往咱用大模型写个综述,看着像模像样的,结果一查参考文献——

好家伙,论文不存在、期刊不存在、作者也不存在(扶额)。

现在不用愁了,Nature新发表了一篇研究,艾伦人工智能研究所(Ai2)和华盛顿大学开源了一个叫OpenScholar的AI系统,写文献综述绝不瞎编。



背靠整整4500万篇科学论文库,直接把GPT-4o那种78%-90%的虚假引用率给干翻了。

那么问题来了,大家都在编,OpenScholar为啥不编?

自我反馈推理

其实主要还是因为LLM的底层逻辑就是预测下一个词出现的概率。

当你问它一个非常生僻的学术问题时,它为了维持语言的连贯性以及“我无所不知”的人设——

会强行根据语料库里的作者名、期刊名、标题关键词,拼凑出一个看起来最像真论文的…幻觉产物。

还有,通用AI缺乏事实锚点,读过万卷书结果全记串了。

张教授写过超导,李教授写过材料,当你问它超导材料时,它能面不改色地给你编出一篇《张教授与李教授关于超导材料的巅峰对话》……

这种由于训练数据截断以及缺乏真实文献验证机制导致的假引用,真的太太太离谱了!



OpenScholar就不一样了,不再拍脑门预测下一个词,直接接入了一个名为ScholarStore的庞大数据库。

这是目前公开的最大科学领域段落索引,全开源可下载,任何人都能本地部署或者扩展。

里面实打实地存了4500万篇论文的全文和摘要,再通过RAG技术,让每个知识点都背靠一篇真实存在的论文。

当你抛出一个科研难题,它会先在那个拥有2.37亿个向量嵌入的超大数据库里疯狂检索,把相关的论文片段全翻出来。

给出初稿之后,带着生成的“这里缺少讨论”“这里引文不准”“需要补搜最新进展”等反馈再检索、再改稿,通过搜索、生成、自我审查、再搜索、再修正这套闭环,反复确认输出的内容是不是真有论文支撑。

这样一来显著降低了幻觉,提高了输出内容的覆盖度和引文精度,整个管道还会被用来生成高质量合成数据,反哺训练。



有多强?

但是!如果只是搜得准,那它充其量是个高级搜索引擎,OpenScholar不止如此。

它在知识合成的深度上,已经开始正面硬刚人类专家了。

研发团队整了个叫Scholar QABench的测试集,涵盖了计算机科学、物理、生物医药等最吃逻辑的领域,由3000个问题和250个长篇专家答案构成。

在自动测评上,OpenScholar-8B这个体量不算大的模型,在正确性上GPT-4o高出5%,比专业的PaperQA2也高出7%,引文准确度和人类专家持平。



团队还搞了个“人机大战”双盲实验,把AI写的答案和实打实的博士、研究员写的答案放一起,然后让另一群顶级科学家来盲评打分。

16位专家两两对比了108份学术答案。结果显示,OpenScholar-8B的回答有51%比人类研究者亲手写的更好,升级组合版的OpenScholar-GPT4o胜率更是冲到70%,而普通GPT-4o只有32%。

评审专家们普遍反馈,OpenScholar的优势集中在信息覆盖更全面、结构更清晰、逻辑连贯性更强,实用价值也更高。

作者团队

这篇研究的一作Akari Asai是艾伦人工智能研究所研究科学家,2026年秋起将任卡内基梅隆大学助理教授。

在此之前她获得了东京大学电气工程与计算机科学专业的学士学位,后在华盛顿大学完成博士学业,研究聚焦于自然语言处理和机器学习,尤其侧重于大型语言模型。



Jacqueline He目前在华盛顿大学读自然语言处理专业博士,本科毕业于普林斯顿大学,曾是普林斯顿自然语言处理小组成员,主要导师是陈丹琦。

读研之前,她还担任过Meta的软件工程师。

Rulin Shao本科毕业于西安交通大学,取得了数学的学士学位,后在卡内基梅隆大学完成了机器学习硕士学位,现为华盛顿大学博士生,同时也是Meta的访问研究员。



团队的其他作者均来自伊利诺伊大学厄巴纳 - 香槟分校、卡内基梅隆大学、Meta、北卡罗来纳大学教堂山分校、斯坦福大学等高校和机构。

论文地址:https://arxiv.org/abs/2411.14199

来源:https://www.163.com/dy/article/KL5SG0PN0511DSSR.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
百度入局AI赛道:2024年11家领军企业最新盘点

百度入局AI赛道:2024年11家领军企业最新盘点

智东西作者 程茜编辑 心缘智东西3月31日消息,昨日,中国联通发布2026年中国联通山东济南市行业客户智算一体机服务项目中标候选人公示,百度以2 9亿元中标。该项目于3月9日发布招标文件,采购内容包

时间:2026-03-31 15:01
京东直播新动作:刚需复杂指令与自由态数字人如何升级

京东直播新动作:刚需复杂指令与自由态数字人如何升级

编辑|泽南刚刚落幕的 2026 科技界「春晚」GTC 大会上,一个全行业的共识已经形成:AI 正在进入智能体(Agent)时代。然而,当各大厂商都在疯狂入局智能体时,一个尴尬的现实却摆在面前:这些聪

时间:2026-03-31 14:55
玻色量子完成10亿元B轮融资,刷新行业融资纪录

玻色量子完成10亿元B轮融资,刷新行业融资纪录

2026年3月31日,“十五五”规划专用量子计算机赛道唯一代表企业——北京玻色量子科技有限公司(以下简称“玻色量子”)完成10亿元B轮融资。本轮融资由北京金控、工银资本、朝阳顺禧、招银国际、深投控和

时间:2026-03-31 14:49
GitLab创始人借力AI抗癌:ChatGPT在现实世界中的真实用途

GitLab创始人借力AI抗癌:ChatGPT在现实世界中的真实用途

Sid 这个案例最震撼我的,不是“AI 参与抗癌”这几个字本身。而是它让我第一次很清楚地感觉到:AI 真正的用途,可能从来都不是回答问题。而是进入那些原本只有专家团队才能推进的复杂现实,把前面的认知

时间:2026-03-31 13:10
Claude已会点外卖!揭秘AI批量替代创业公司的未来危机

Claude已会点外卖!揭秘AI批量替代创业公司的未来危机

说句心里话,我确实不太待见 Anthropic(Claude 背后那家公司),但这并不妨碍它依然是目前全球最顶尖、最牛掰的 AI 公司,没有之一。这个世界就是这么现实:能力强弱和是非对错,那是两码事

时间:2026-03-31 13:04
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程