智能体填报高考志愿能对抗幻觉与数据陷阱吗

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

科技数码

智能体填报高考志愿能对抗幻觉与数据陷阱吗

热心网友时间：2026-06-11

转载

如果把每年双11视为阿里对电商业务的年度大考核，那么每年6到7月的高考志愿报告季，则是其Agent系统在算力峰值上面临的一场硬仗。

去年，夸克首次推出“AI志愿报告”功能，最终用户领取量接近1300万份。算一笔账：单份报告生成需要5到10分钟，内部估算下来，一份报告背后相当于发起上万次搜索，对算力的消耗可想而知。为了应对高考季（6月中下旬）的集中爆发，夸克当时把相关算力投入直接拉升了100倍，还调动了整个阿里集团的资源来兜底——当然，具体的资源绝对值并未公开。

到了今年6月10日，阿里旗下千问正式上线了国内首个覆盖全周期的高考志愿填报Agent。这个新Agent基于千问高考志愿大模型，再加上夸克8年来积累的高考数据与经验，形成了“志愿报告”“志愿日历”“志愿问答”三大核心能力。如果按单份AI志愿填报报告生成15到40页A4纸PDF的规模来算，这又是一次对算力资源的极致消耗。千问团队没有对外回应具体的算力消耗规模，但在发布会后，千问事业部产品负责人郑嗣寿明确表示：“在高考志愿这件事上，从阿里全集团的角度来看，是不做任何限制的，我们得到了阿里云乃至全集团所有算力的支撑，这个我们可以直接承诺。”

Agent填报机制与大模型应用本质不同

眼下，全国各地的高考已经结束，1290万人（2026年全国高考报名人数）——或者说1290万个家庭的另一场战役已经打响：“志愿填报”正在进入白热化阶段。

考生和家长打开手机，各式各样的“AI志愿助手”铺天盖地，个个号称能“一键生成完美方案”、精准预测录取概率。但在这股AI热潮背后，一个真实的担忧始终挥之不去：如果AI“一本正经地胡说八道”——也就是产生幻觉，把前途算错了，怎么办？

本质上，高考志愿填报是一个有限理性下的多属性风险决策模型。它是一次性的、结构不清晰、没有现成标准答案的重大人生决策，无法靠固定程序来解决，需要个人的判断力、创造力和大量信息处理能力。

考生可以根据往年录取位次、线差等数据，大致估算出被某校某专业录取的概率，但信息并不完美，还存在着“大小年”之类的波动。同时，填报过程需要权衡多个相互冲突的目标：学校层次、专业实力与兴趣、所在城市、就业前景、学费等等。不可能用一个指标就简单决定，这本质上是一个多目标决策问题。

现实中，考生和家长不可能掌握所有信息，也没办法把所有备选方案都列出来一一比较——平行志愿的数量是有限的。认知和时间都有天花板，所以人们通常寻找的是“足够好”的满意解，而不是理论上的全局最优解。这个过程高度依赖启发式判断，还会受到情绪、社会比较等因素的影响。

千问事业部AI算法负责人蒋冠军分析说，高考志愿填报决策极其复杂，涉及院校、专业、地域、就业等十个核心维度，理论上的组合空间高达上亿种。面对这样复杂的决策场景，缺乏领域知识的通用大模型不仅容易犯事实错误，也缺少真实志愿填报中“如何平衡冲、稳、保”的专家经验。

因此，基于千问基础大模型，算法团队把志愿规划师的专家思考路径提取出来，转化为多轮对话与推理链的训练数据，通过强化学习建模和监督微调，让模型形成“规划、执行、反思”的推理机制。千问还构建了一个覆盖约40万种组合空间的“AI考生”体系，对模型进行反复压测，确保它能应对志愿填报的各种情况。

那么，Agent机制和传统的大语言模型应用到底有什么不同？

郑嗣寿解释说，传统大模型是用户问一个问题，模型直接给出答案——在这个过程中，模型会去搜索最新资料，参考资料做总结和回答。但Agent有天然的不同：它接到问题后，会经历一个从思考、规划、执行，再到思考、规划、执行的反复循环过程。

在公共Agent部分，拿到问题后，它先想的是：这个问题背后，用户的真实意图是什么？有的简单，有的复杂，有的还是连续的。Agent如果判断问题简单，就直接给出答案；如果问题复杂，需要几个步骤、几个工具组合起来回答，那它就开始规划各种工具。

此外，千问志愿的Agent还组建了一个300多人的志愿填报专家团队，把专家思考具体志愿问题的经验抽离出来，变成数据让Agent掌握。结合志愿填报场景做深度的优化和建设——这是高考志愿Agent有别于其他Agent的关键所在。

不过，在千问的逻辑里，Agent不能盲目自信。对于那些“超出规则”的敏感问题——比如“家里没背景别学金融”这类带有主观色彩的经验之谈，千问采取了相对谨慎的策略。

“我们不会把这些抽象成通用规则让模型去死记硬背。”郑嗣寿解释说，因为今年和去年相比，很多企业和行业规则可能已经变了。对于这种动态的、语境化极强的信息，不做通用回答，而是引导用户去思考当下的具体情况。千问选择让AI扮演“辅助者”的角色，在那些AI容易“翻车”的边缘地带，保留了人类的复核机制。

“归根到底，今天整个AI的发展，其实还是AI在学人。但有些地方机器做得比人好，而肯定还有很多地方，机器是不如人的。”蒋冠军表示。在他看来，人类咨询师能做的是“感同身受”，他们有天然的背景知识，这种同理心是天然“对齐”的，这是人比机器有优势的地方。而当用户用Agent来问高考问题时，很多信息其实并没有那么对齐，所以Agent必须采取追问机制，让用户提交资料，尽量做到信息对齐。

那些“非AI”叙事的笨功夫

“坦率讲，我们在高考这件事情上没有竞品。”郑嗣寿说。

但有意思的是，千问在高考领域积累了8年的护城河，其中一项关键工作，其实属于最“笨”的数据清洗。据郑嗣寿透露，千问内部有一个数据团队全年都在做高考相关数据，尤其是基础数据和招录数据的校验与补全。为此，他们还投资了一家公司，专门做与高考数据有关的事情。

数据清洗有非常多苦活、累活。在高考志愿填报场景里，除了大家都知道的——全国各地高考分数线不是统一公布的，它们散落在各个学校的官网、考试院，甚至是一本本纸质的“大本”里——团队还发现了一些更难解决的问题。

比如，有时候哪怕是标准本上的数据也可能有问题。如果把几年数据累加在一起，就更难了——因为专业改名了，专业做了调整，两个专业合并了……这些边界条件非常复杂。因此，在整个志愿回答里，千问Agent会特别注重溯源机制。这种设计在技术上增加了巨大的复杂度。通常大模型生成回答是一气呵成的，而千问则要求模型在生成每一个数据点时，都要“回头看”，都要绑定一个可信的源头。这相当于给AI套上了一副“脚镣”，让它每走一步都得“有据可查”。

“这是我们在用尽所有的力量去对抗大模型天然的漏洞。如果数据实在太多，或者不同来源有出入，我们的办法是把不同的来源都列出来，展示给用户。”郑嗣寿说。

来源:https://www.163.com/dy/article/KV4SRO8Q05118O92.html

上一篇：工程干细胞逆转新发1型糖尿病获小鼠模型验证

下一篇：美AI数据中心密集建设加剧干旱危机