面包屑图标 当前位置: 首页
AI资讯
热点详情

利用思考增强RAG嵌入及推理模型实践前沿

AI热点日报
AI热点日报时间:2026-06-30
热点解读

大模型领域最近又有不少有意思的动向,今天咱们就来盘一盘几个关键方向:GraphRAG 的落地进展、OpenAI 推理模型的最佳实践、深度思考与 RAG 的融合成果,以及它们在医疗等场景中的应用价值。话不多说,直接上干货。 今天是 2025 年 2 月 15 日,星期六,北京晴好。我们来梳理一下大模型

大模型领域最近又有不少有意思的动向,今天咱们就来盘一盘几个关键方向:GraphRAG 的落地进展、OpenAI 推理模型的最佳实践、深度思考与 RAG 的融合成果,以及它们在医疗等场景中的应用价值。话不多说,直接上干货。

Think思考用来增强RAG的Embedding?兼看推理模型使用实践建议等前沿进展

今天是 2025 年 2 月 15 日,星期六,北京晴好。我们来梳理一下大模型领域昨日更新的几个有趣进展,重点围绕 GraphRAG、OpenAI 推理模型使用实践、大模型训练注意力机制以及 DeepSeek 推理建议 等话题展开,供大家参考。

另外,还有一个值得关注的方向:深度思考与 RAG 结合。具体来说,是在生成嵌入(Embedding)的同时,让 LLM 输出思考过程(thought),这跟之前的 HyDE 做法有异曲同工之妙。

专题化、体系化地推进这些技术,能带出更多深度思考。大家一起加油。

一、昨日大模型的一些有趣进展

接着聊聊昨天出现的几个值得关注的工作。

1、GraphRAG 进展:PIKE-RAG

PIKE-RAG(sPecIalized KnowledgE and Rationale Augmented Generation)是微软开源的一个新方案,核心思路是通过提取、理解并应用领域特定知识,同时构建连贯的推理逻辑,一步步引导 LLM 产出答案。它由几个基本模块组成:文档解析、知识抽取、知识存储、知识检索、知识组织、以知识为中心的推理,以及任务分解与协调。项目地址:论文GitHub

2、推理模型使用实践建议

OpenAI 官方博客刚发布了一篇关于推理类模型(如 o1、o3)的最佳实践指南,内容同样适用于 DeepSeek R1。文章详细说明了如何将 GPT 模型与 o1 这类推理模型结合起来,最大化收益。比如,如何有效地使用推理模型,以及两者配合的策略。参考链接:官网指南

3、GraphRAG 进展:MedRAG 医疗问答路线

GraphRAG 在医疗领域有了新应用——MedRAG。该方案结合知识图谱进行上下文扩展,为医疗问答提供了更可靠的路径。具体技术细节可参见相关文章。

4、大模型训练注意力机制进展:TransMLA

一项名为《TransMLA: Multi-head Latent Attention Is All You Need》的工作,提出了多头潜注意力(MLA)机制。理论分析和实验都证明,MLA 在相同 KV 缓存开销下,表达能力超越了 GQA。作者还推出了 TransMLA 方法,能将现有的 GQA 模型转换为高性能的 MLA 模型,为解决 LLM 的 KV 缓存瓶颈提供了新思路。论文:arXiv,代码:GitHub

5、DeepResearch 开源复现:SciraAI 的 Extreme 模式

SciraAI 开源了一个完全开源的 DeepResearch 搜索实现,称为 Extreme 模式。它会自动制定研究计划、搜索内容、深入分析,并提供实时进度更新和详细响应。有人用它搜索 DeepSeek 的信息并分析 R1 模型对行业的影响,结果跑了 16 步,最终质量与 Gemini Thinking 调用搜索的结果相当,但还达不到 OpenAI DeepResearch 的水平。项目地址:GitHub

6、推理时扩展提升大模型推理能力

一篇《Can 1B LLM Surpass 405B LLM? Rethinking Compute-Optimal Test-Time Scaling》的论文,通过实证分析展示了计算最优的 TTS(Test-Time Scaling)策略。内部 TTS 通过训练模型“慢速思考”来提升推理能力,外部 TTS 则依赖采样或搜索方法改进推理性能。文中使用了 PRM-Min、PRM-Last、PRM-A vg 等评分方法,以及 MajorityVote、PRM-Max、PRM-Vote 等投票方法。实验采用了 Best-of-N(BoN)、束搜索和多样化验证树搜索(DVTS)三种方式,在推理过程中动态分配计算资源。要最大化 TTS 性能,核心在于奖励策略的设定——选择与特定测试时策略对应的超参数,从而在特定提示上获得最佳收益。

7、DeepSeek 推理建议、参数设定及联网搜索 Prompt 开源

DeepSeek 官方在 GitHub 上开源了 R1 模型的详细使用建议、参数设定以及联网搜索的 Prompt 模板。具体内容可查看其官方仓库:GitHub。例如,使用建议如下:

联网搜索的 Prompt 示例:

二、深度思考与 RAG 结合:让 Embedding 带上“思考”

接着聊深度思考与 RAG 的结合,重点看看在 Embedding 层面的创新。

有一篇名为《O1 Embedder: Let Retrievers Think Before Action》(论文链接:arXiv)的工作,思路很直接:生成关于输入查询的 thought(思考),然后将 thought 与 question 拼接在一起,分别独立生成嵌入,再通过池化聚合。说白了,这个 Embedding 模型比传统模型多了一个 thought 输出的通道。

那么,如何让模型具备这种能力?答案是通过微调,两个并行任务一起上:一个是 thought 生成,另一个是对比学习。

微调数据怎么来?先利用 LLM 生成初始 thought,然后使用检索评分器,根据初始 thought 与目标文档之间的相关性进行评分,最终通过多数投票选出最佳的 thought。

在多个数据集上的表现相当亮眼:在 MS MARCO、DL'19 和 DL'20 上,O1 Embedder 在所有评价指标上均超越了 BM25、ANCE、TAS-B、coCondenser、SimLM、RepLLaMA、Promptiever 等模型。在 MS MARCO(dev)、TREC DL19、TREC DL20 以及 BEIR 等外部数据集上,O1 Embedder 平均提高了 2.3%,展现了不错的泛化能力。

尤其值得关注的是,在涉及复杂推理的任务(如 HotPotQA 和 CosQA)中,O1 Embedder 表现出色。思考机制在部分开放 QA 数据集上带来了显著提升,例如 NQ 数据集提高了 3.9%,HotPotQA 提高了 3.0%。这进一步印证了“让检索器先思考再行动”这一思路的有效性。

热点追踪提示词
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:利用思考增强RAG嵌入及推理模型实践前沿要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
来源:https://www.53ai.com/news/RAG/2025021510537.html
ai 人工智能

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关热点
AI热点2026-06-30 19:04
AI驱动的Degiro投资组合跟踪与可视化工具

在 Degiro 上进行投资的用户,常常会遇到一个共同的痛点:平台自带的数据展示较为基础,若想获取更深入的投资组合分析、风险指标,甚至对未来走势做出预测,通常只能借助 Excel 手动处理。不过,现在有一款 Chrome 扩展程序可以完美解决这一难题——Mercury,专为 Degiro 用户量身打

AI热点2026-06-30 19:04
Lorna基于CFMS数据驱动决策的投资平台

在投资决策过程中,客观数据往往比主观直觉更值得信赖。名为Lorna的智能平台,运用独特的现金流分析体系,帮助投资者穿透虚饰的财务报表,直达企业真实的财务健康状况。 什么是Lorna?——数据驱动的现金流分析投资工具 简而言之,Lorna是一个以数据为核心驱动力的投资分析工具。其核心利器是独创的“现金

AI热点2026-06-30 19:03
前街购买记录追踪查询方法

Front Street自动追踪你的每一笔消费,整合各类忠诚度计划,并提供财务洞察与省钱妙招——说白了,就是帮你把钱&包管得明明白白。 什么是Front Street? 简单讲,Front Street就是你的购物管家。它自动记录你在每个品牌、每家店的所有购买行为,然后把零散的忠诚度计划全部整合到一

AI热点2026-06-30 19:03
一款专业Finta AI驱动筹款助手,高效智能募资工具

在创投圈深耕多年,你会发现一个普遍难题:融资过程中,投资者关系维护、尽职调查、潜在投资人挖掘……这些环节往往耗费巨大精力,却又直接决定成败。如果能有一款工具将这些琐事自动化,让团队聚焦于真正重要的沟通与战略决策,那该多理想?Finta 正是为此而生。 什么是Finta? Finta 本质上是一款 A

延伸阅读