大模型理解地图地址:从地理编码到空间相关性
导 读 地理编码,简单来说,就是将“北京市海淀区成府路10号”这类日常口语地址,转化为机器可识别的经纬度坐标,为导航、搜索等位置服务提供支撑。传统方法依赖一套复杂流水线:先通过NER分词拆解省、市、区、路、门牌号,再在数据库中进行检索与排序。看似合理,但面对口语化表达、缩写、方言等“非标准”输入时,
导 读
地理编码,简单来说,就是将“北京市海淀区成府路10号”这类日常口语地址,转化为机器可识别的经纬度坐标,为导航、搜索等位置服务提供支撑。传统方法依赖一套复杂流水线:先通过NER分词拆解省、市、区、路、门牌号,再在数据库中进行检索与排序。看似合理,但面对口语化表达、缩写、方言等“非标准”输入时,往往准确率骤降。近期,团队在ACL 2026上发表了ReaGeo——一种基于大语言模型的端到端地理编码框架。该框架直接让LLM从文本生成Geohash坐标序列,借助思维链(CoT)增强空间推理能力,再通过GRPO强化学习将定位精度推向极致。模型不仅能定位“五道口地铁站”这类标准地址,还能理解“五道口地铁站南200米”这种带方向方位的模糊描述。在北京城区数据测试中,平均偏差仅为119.6米,500米内准确率高达97.2%。
本文不止于地理编码本身,更从搜索引擎视角深挖一个更广义的问题:空间相关性。用户搜索“南开大学”时,到底想找哪个校区?地图搜索中如何建模这类“where-what”型问题?这些思考,正是地理编码研究背后真正有趣的地方。
论文链接:https://arxiv.org/pdf/2604.21357
---
传统向量检索流水线(上)vs ReaGeo端到端生成流程(下)
`和` `标记中间推理过程。推理阶段可以关闭thinking来节省开销。
输入:
“Snow-covered courtyard ”
输出:
“100 meters south of the intersection of XX Road and XX Road, XX District w x 4 e j 8 m d t”
**第二阶段:GRPO强化学习优化**
在SFT基础上,ReaGeo采用GRPO(Group Relative Policy Optimization)进一步优化。不需要额外训练价值模型,而是对同一输入生成多个候选输出,按组内相对奖励更新策略。
特别设计了一个基于地理空间距离偏差的奖励函数:
R = (T − √D(ypred, ytrue)) ⁄ S
其中T=100,D(·)是WGS-84椭球大地测量距离(米),S=1000。预测越接近真实位置,奖励越高。训练数据里加入了“XX路口南偏200米”等随机偏移描述,专门用来强化方向和距离的推理能力。
输入:
“50 meters north of No.385 XX Road, XX Town, XX District, XX”
输出:
“w x 4 s f d v p y”
**实验验证:全面超越商用API与学术基线**
实验使用北京市城区和郊区共239,918条数据样本(来源:高德搜索引擎日志和高德POI数据库),分为“基础数据”和“锚点偏移数据”两类场景,完全覆盖非标准地址查询,与6种基线方法对比。
几个关键发现:
- **Qwen3-Max零样本近乎失效。** 即使是当前最强的通用大模型,不经过地理编码专项训练,Acc@100接近0%。说明地理编码不是“通用智能”能轻松解决的任务。
- **商用API表现平庸。** 百度地图和腾讯地图在非标准地址上表现有限,受限于匹配机制和数据覆盖。
- **ReaGeo全面领先。** 城区基础数据ADD仅119.6米,Acc@500达97.2%;在更具挑战的锚点偏移场景,优势更明显——城区Acc@200达71.5%,而百度地图只有42.2%。
119.6米 **城区基础ADD**
97.2% **Acc@500准确率**
**消融实验**
进一步分析显示:
- 仅移除GRPO,Acc@100就从51.3%跌到40.6%,说明强化学习对精细化空间推理至关重要;
- 移除CoT,无效输出错误数从20猛增至80,模型更容易“胡说”;
- 完整框架下性能最优,证明“思维链推理+强化学习优化”的闭环是精度领先的关键。
此外,论文还验证了几个关键技术选择:
- **为什么用Geohash而不是直接输出经纬度?** 消融对比显示,Geohash序列输出(ADD 427.7米,Acc@100 68.8%)优于直接生成经纬度坐标(ADD 440.1米,Acc@100 68.7%)。原因在于Geohash通过递归二分将连续地理空间离散化为序列格式,与语言模型的自回归文本生成机制天然契合,同时支持渐进式精度控制——每多输出一个字符,定位精度就提高约4倍。
- **对未见方向描述的泛化能力。** 论文构造了包含“东北”“东南”“西北”“西南”四个非基本方向的测试集。模型从未在训练中见过这些方向词,但在intercardinal方向上仍取得了ADD 562.9米、Acc@100 22.4%的效果,与基本方向(ADD 524.8米,Acc@100 32.6%)差距有限。说明模型真正学会了空间方向推理,而非简单记忆训练数据中的模式。
另外,Qwen2.5-3B在精度与效率之间取得最佳平衡:模型规模更大时精度继续提升,但推理延迟也会随之增长。
标记2-5为模型根据相对位置提示在地标1周围的预测结果
**从点定位到空间分布:ReaGeo的更广能力**
论文里有个容易被忽略但极具启发性的发现:ReaGeo不仅能做精确的点定位,还能处理线状POI(比如道路)和面状POI(比如行政区)。
对于道路类POI,ReaGeo多次采样的预测点会自然沿道路分布,形成线状热力模式——虽然部分点偏离道路中心线,但整体走向与实际道路高度一致。对于行政区类POI,预测点的分布热力图覆盖了约70%的行政区域面积,且高度集中在核心城区。
ReaGeo对线状和面状query的推理能力,也引申出搜索引擎的一个重要概念:空间相关性。
---
空间相关性包含两个核心维度:
- **Geographical Anticipation(空间意图指向)**
Query中表达的“where”意图是什么?“朝阳望京”指向望京区域,“沙河白各庄”指向昌平区沙河镇——不同的query有不同的空间意图范围。
- **Geographical Sensitivity(距离敏感度)**
不同类型的POI对距离的敏感程度截然不同。建材市场、肯德基、烟酒、景点、美食、商场——这些品类的用户容忍半径差异巨大。搜索“肯德基”的用户可能愿意走500米,但搜索“建材市场”的用户可能愿意跨越整个城市。
下图展示了不同搜索词对空间距离和POI热度的敏感度分析。
**地图搜索,皆为“where-what”问题**
在搜索引擎视角下,所有地图检索问题都可以抽象为“where-what”二元框架:在哪里(where)查什么(what)。比如query“五道口美食”是典型的WhereWhat类型检索。即使query中没有显式的Where+What形式,比如query“美食”,其实也有一个隐含的Where——“我的位置附近”。空间相关性建模对于解决Where-What类型query非常有帮助。比如query“沙河白各庄”,传统的基于term完全匹配的检索未必能找回目标POI,因为doc文本可能不完备。但基于空间相关性思维,可以推理这个query的空间意图指向,从而基于部分term召回,再经过文本和空间相关性的综合排序后,给出最终搜索结果。如下图所示。
**ReaGeo与空间相关性的内在联系**
回头看ReaGeo,它本质上是在解决空间相关性的一个极端特例——当空间相关性score的分布退化为一个尖峰(delta function)时,就是精确的地理编码。ReaGeo通过端到端生成Geohash序列,直接输出最高相关性的位置。
但论文揭示的线状和面状POI预测能力表明,ReaGeo内部隐式地建模了更广泛的空间分布——而不仅仅是输出一个点。这意味着它同时具备了精确geocoding和空间相关性估计的潜力。
---
来源:https://www.aixq.cc/46035.html
01 地理编码:让机器读懂地图地址
地理编码将人类可读的地理位置描述转换为机器可读的坐标,是数字地图、导航和空间定位的基础能力。Google Maps、Bing Maps、高德地图等平台都以地理编码API作为核心公共服务之一,全球日调用量超过百万次,覆盖电商、物流、城市规划、灾害管理等领域。 传统方案的主流做法是一条多阶段流水线:先用NER切出省、市、区、路、门牌号,再到大型地理数据库里做文本或向量检索匹配。但真实场景里,地址查询往往缺乏标准格式,缩写、方言、口语化表达层出不穷。这些语义上的不一致,让检索难度直线上升。实验数据表明,面对非标准地址描述时,当前SOTA模型的定位准确率平均下降超15%,模糊位置查询的表现尤其惨烈。
传统向量检索流水线(上)vs ReaGeo端到端生成流程(下)
问题核心
现有方法过度依赖“人工预置地理知识库”,一旦脱离理想化设定,大模型便难以从原始文本中自主推理出关键空间语义线索。 ---02 ReaGeo:让大模型“端到端”学会地理编码
其实这些所谓的“地理知识”,大量都内生于地址文本自身。与其被动维护一个知识库,不如让模型直接从文本里“学”出空间映射。我们提出ReaGeo——一种不依赖外部地理数据库、仅通过端到端文本生成就能完成坐标预测的新范式。核心思路:地址文本本身蕴含丰富的空间知识。用Geohash编码把坐标转成文本序列,大模型只需要像写文章一样自回归地输出一串字符,地理编码就完成了。 具体来说,ReaGeo基于Qwen2.5-3B模型,使用Geohash编码(Base32,长度9,精度约2.4米)将坐标转为文本序列,整个训练分为两个阶段。 **第一阶段:CoT(思维链)增强的SFT** 想让模型理解“XX路口南200米”这样的模糊描述,得让它学会推理。训练时,对每个POI地址,以邻近地址为起点计算相对位置关系,作为中间推理步骤,引导模型先理解周边环境,再输出Geohash。结合Qwen的thinking模式标签机制,用`
几个关键发现:
- **Qwen3-Max零样本近乎失效。** 即使是当前最强的通用大模型,不经过地理编码专项训练,Acc@100接近0%。说明地理编码不是“通用智能”能轻松解决的任务。
- **商用API表现平庸。** 百度地图和腾讯地图在非标准地址上表现有限,受限于匹配机制和数据覆盖。
- **ReaGeo全面领先。** 城区基础数据ADD仅119.6米,Acc@500达97.2%;在更具挑战的锚点偏移场景,优势更明显——城区Acc@200达71.5%,而百度地图只有42.2%。
119.6米 **城区基础ADD**
97.2% **Acc@500准确率**
**消融实验**
进一步分析显示:
- 仅移除GRPO,Acc@100就从51.3%跌到40.6%,说明强化学习对精细化空间推理至关重要;
- 移除CoT,无效输出错误数从20猛增至80,模型更容易“胡说”;
- 完整框架下性能最优,证明“思维链推理+强化学习优化”的闭环是精度领先的关键。
此外,论文还验证了几个关键技术选择:
- **为什么用Geohash而不是直接输出经纬度?** 消融对比显示,Geohash序列输出(ADD 427.7米,Acc@100 68.8%)优于直接生成经纬度坐标(ADD 440.1米,Acc@100 68.7%)。原因在于Geohash通过递归二分将连续地理空间离散化为序列格式,与语言模型的自回归文本生成机制天然契合,同时支持渐进式精度控制——每多输出一个字符,定位精度就提高约4倍。
- **对未见方向描述的泛化能力。** 论文构造了包含“东北”“东南”“西北”“西南”四个非基本方向的测试集。模型从未在训练中见过这些方向词,但在intercardinal方向上仍取得了ADD 562.9米、Acc@100 22.4%的效果,与基本方向(ADD 524.8米,Acc@100 32.6%)差距有限。说明模型真正学会了空间方向推理,而非简单记忆训练数据中的模式。
另外,Qwen2.5-3B在精度与效率之间取得最佳平衡:模型规模更大时精度继续提升,但推理延迟也会随之增长。
标记2-5为模型根据相对位置提示在地标1周围的预测结果
**从点定位到空间分布:ReaGeo的更广能力**
论文里有个容易被忽略但极具启发性的发现:ReaGeo不仅能做精确的点定位,还能处理线状POI(比如道路)和面状POI(比如行政区)。
对于道路类POI,ReaGeo多次采样的预测点会自然沿道路分布,形成线状热力模式——虽然部分点偏离道路中心线,但整体走向与实际道路高度一致。对于行政区类POI,预测点的分布热力图覆盖了约70%的行政区域面积,且高度集中在核心城区。
核心发现
这意味着什么?ReaGeo输出的不是单一的“确定性坐标”,而是一个隐式的空间概率分布。当模型对某个query的预测高度集中时,它退化为精确的地理编码;当预测分散时,它呈现出类似空间相关性的热力分布。这一发现刚好连接了精确geocoding与广义空间相关性之间的鸿沟。
ReaGeo对线状和面状query的推理能力,也引申出搜索引擎的一个重要概念:空间相关性。
---
03 从地理编码到空间相关性:搜索引擎视角
ReaGeo解决了“给定一个地址描述,输出精确坐标”的问题。但这只是地图搜索的一部分。如果视角拉高到整个搜索引擎架构,会发现地理编码本质上是一个更广义问题的特例——(文本)空间相关性(Text-Spatial Correlation)建模。 **什么是空间相关性?** 简单说,空间相关性描述的是查询词(Query)与地理空间特定位置之间的相关关系及强度。它不仅能指向这个地址对应哪个坐标,也能指向查询词指向的区域。 举个例子。用户搜索“南开大学”时,可能存在多个候选POI: - POI1——南开大学(主校区) - POI2——南开大学图书馆 - POI3——南开大学滨海学院 用户的真实意图是哪一个?传统大搜引擎中,是用文本相关性来衡量query与Doc之间的相关关系。在LBS搜索中,除了文本相关性,还有空间相关性。南开大学有三个校区,搜索“南开大学”时,可能指代哪一个?这既与各个校区的热度有关,也与用户和各个校区的相对位置有关。这就是空间相关性要回答的问题。下图是文本相关性与空间相关性的直观对比。
空间相关性包含两个核心维度:
- **Geographical Anticipation(空间意图指向)**
Query中表达的“where”意图是什么?“朝阳望京”指向望京区域,“沙河白各庄”指向昌平区沙河镇——不同的query有不同的空间意图范围。
- **Geographical Sensitivity(距离敏感度)**
不同类型的POI对距离的敏感程度截然不同。建材市场、肯德基、烟酒、景点、美食、商场——这些品类的用户容忍半径差异巨大。搜索“肯德基”的用户可能愿意走500米,但搜索“建材市场”的用户可能愿意跨越整个城市。
下图展示了不同搜索词对空间距离和POI热度的敏感度分析。
**地图搜索,皆为“where-what”问题**
在搜索引擎视角下,所有地图检索问题都可以抽象为“where-what”二元框架:在哪里(where)查什么(what)。比如query“五道口美食”是典型的WhereWhat类型检索。即使query中没有显式的Where+What形式,比如query“美食”,其实也有一个隐含的Where——“我的位置附近”。空间相关性建模对于解决Where-What类型query非常有帮助。比如query“沙河白各庄”,传统的基于term完全匹配的检索未必能找回目标POI,因为doc文本可能不完备。但基于空间相关性思维,可以推理这个query的空间意图指向,从而基于部分term召回,再经过文本和空间相关性的综合排序后,给出最终搜索结果。如下图所示。
**ReaGeo与空间相关性的内在联系**
回头看ReaGeo,它本质上是在解决空间相关性的一个极端特例——当空间相关性score的分布退化为一个尖峰(delta function)时,就是精确的地理编码。ReaGeo通过端到端生成Geohash序列,直接输出最高相关性的位置。
但论文揭示的线状和面状POI预测能力表明,ReaGeo内部隐式地建模了更广泛的空间分布——而不仅仅是输出一个点。这意味着它同时具备了精确geocoding和空间相关性估计的潜力。
---
04 业务场景应用展望
ReaGeo和空间相关性技术不只是学术创新。高德地图正在把这些前沿成果转化为实际产品能力:交通报警快速定位、物流订单目的地智能识别、自然语言地图搜索——这些曾经需要复杂流水线才能完成的任务,如今一个端到端模型就能搞定。基于此,也为零售、物流、城市规划等众多行业客户提供基于自然语言的地理空间智能服务。 ---结语:让大模型更好地理解地图
地理编码的终极目标,是让非技术人员也能通过自然语言自如地访问地理空间信息。ReaGeo把地理编码从“分词→检索→排序”的多阶段流水线,重构为端到端的文本生成任务,不仅大幅降低了对外部知识库的依赖,更提供了一条低成本、高鲁棒、可解释的工业部署路径。 当大模型不再“裸奔”于地址文本之上,而是真正“理解”了空间关系——从精确的地理编码到广义的空间相关性,从坐标输出到意图分布——对话式地图交互、自然语言导航、智能物流定位的时代,或许已不再遥远。 #ReaGeo #地理编码 #大模型 #高德 #高德技术
热点追踪提示词
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:大模型理解地图地址:从地理编码到空间相关性要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
相关热点AI热点2026-07-05 19:47
OmniParser基于AI的解析工具
OmniParser是微软AI驱动的SaaS工具,基于YOLOv8和BLIP-2,将UI截图与漫画页面解析为结构化数据,支持UI元素检测、漫画面板分析、对话框及人脸识别,适用于自动化测试、漫画翻译等场景。
AI热点2026-07-05 19:47
通义灵码智能编码助手助你高效编程
通义灵码是贯穿开发全流程的智能编码助手,具备代码智能生成、研发智能问答、多编程语言及编辑器支持、代码安全隐私保障四大核心能力,适用于学生、新手及企业开发者等多类人群,提升编码效率。
AI热点2026-07-05 19:47
基于AI的自动化道路巡逻与资产数据收集方案
基于人工智能的自动化道路巡逻和资产数据收集方案,通过车载相机自动采集路面及周边资产数据,识别裂缝、坑槽等病害并建立数字化台账,同时自动删除隐私图像,实现从被动响应向主动预防的转变,降低巡检成本。
AI热点2026-07-05 19:47
通义智文AI助你高效阅读全网文章
阿里旗下通义智文是一款智能阅读工具,支持网页、论文、图书和自由阅读四种场景,帮助用户快速提取核心观点,节省阅读时间,适合学生、研究人员及职场人士高效处理大量文本。
- 日榜
- 周榜
- 月榜
热点快看
