智能体填报高考志愿能对抗幻觉与数据陷阱吗
如果把每年双11视为阿里对电商业务的年度大考核,那么每年6到7月的高考志愿报告季,则是其Agent系统在算力峰值上面临的一场硬仗。
去年,夸克首次推出“AI志愿报告”功能,最终用户领取量接近1300万份。算一笔账:单份报告生成需要5到10分钟,内部估算下来,一份报告背后相当于发起上万次搜索,对算力的消耗可想而知。为了应对高考季(6月中下旬)的集中爆发,夸克当时把相关算力投入直接拉升了100倍,还调动了整个阿里集团的资源来兜底——当然,具体的资源绝对值并未公开。
到了今年6月10日,阿里旗下千问正式上线了国内首个覆盖全周期的高考志愿填报Agent。这个新Agent基于千问高考志愿大模型,再加上夸克8年来积累的高考数据与经验,形成了“志愿报告”“志愿日历”“志愿问答”三大核心能力。如果按单份AI志愿填报报告生成15到40页A4纸PDF的规模来算,这又是一次对算力资源的极致消耗。千问团队没有对外回应具体的算力消耗规模,但在发布会后,千问事业部产品负责人郑嗣寿明确表示:“在高考志愿这件事上,从阿里全集团的角度来看,是不做任何限制的,我们得到了阿里云乃至全集团所有算力的支撑,这个我们可以直接承诺。”
Agent填报机制与大模型应用本质不同
眼下,全国各地的高考已经结束,1290万人(2026年全国高考报名人数)——或者说1290万个家庭的另一场战役已经打响:“志愿填报”正在进入白热化阶段。
考生和家长打开手机,各式各样的“AI志愿助手”铺天盖地,个个号称能“一键生成完美方案”、精准预测录取概率。但在这股AI热潮背后,一个真实的担忧始终挥之不去:如果AI“一本正经地胡说八道”——也就是产生幻觉,把前途算错了,怎么办?
本质上,高考志愿填报是一个有限理性下的多属性风险决策模型。它是一次性的、结构不清晰、没有现成标准答案的重大人生决策,无法靠固定程序来解决,需要个人的判断力、创造力和大量信息处理能力。
考生可以根据往年录取位次、线差等数据,大致估算出被某校某专业录取的概率,但信息并不完美,还存在着“大小年”之类的波动。同时,填报过程需要权衡多个相互冲突的目标:学校层次、专业实力与兴趣、所在城市、就业前景、学费等等。不可能用一个指标就简单决定,这本质上是一个多目标决策问题。
现实中,考生和家长不可能掌握所有信息,也没办法把所有备选方案都列出来一一比较——平行志愿的数量是有限的。认知和时间都有天花板,所以人们通常寻找的是“足够好”的满意解,而不是理论上的全局最优解。这个过程高度依赖启发式判断,还会受到情绪、社会比较等因素的影响。
千问事业部AI算法负责人蒋冠军分析说,高考志愿填报决策极其复杂,涉及院校、专业、地域、就业等十个核心维度,理论上的组合空间高达上亿种。面对这样复杂的决策场景,缺乏领域知识的通用大模型不仅容易犯事实错误,也缺少真实志愿填报中“如何平衡冲、稳、保”的专家经验。
因此,基于千问基础大模型,算法团队把志愿规划师的专家思考路径提取出来,转化为多轮对话与推理链的训练数据,通过强化学习建模和监督微调,让模型形成“规划、执行、反思”的推理机制。千问还构建了一个覆盖约40万种组合空间的“AI考生”体系,对模型进行反复压测,确保它能应对志愿填报的各种情况。
那么,Agent机制和传统的大语言模型应用到底有什么不同?
郑嗣寿解释说,传统大模型是用户问一个问题,模型直接给出答案——在这个过程中,模型会去搜索最新资料,参考资料做总结和回答。但Agent有天然的不同:它接到问题后,会经历一个从思考、规划、执行,再到思考、规划、执行的反复循环过程。
在公共Agent部分,拿到问题后,它先想的是:这个问题背后,用户的真实意图是什么?有的简单,有的复杂,有的还是连续的。Agent如果判断问题简单,就直接给出答案;如果问题复杂,需要几个步骤、几个工具组合起来回答,那它就开始规划各种工具。
此外,千问志愿的Agent还组建了一个300多人的志愿填报专家团队,把专家思考具体志愿问题的经验抽离出来,变成数据让Agent掌握。结合志愿填报场景做深度的优化和建设——这是高考志愿Agent有别于其他Agent的关键所在。
不过,在千问的逻辑里,Agent不能盲目自信。对于那些“超出规则”的敏感问题——比如“家里没背景别学金融”这类带有主观色彩的经验之谈,千问采取了相对谨慎的策略。
“我们不会把这些抽象成通用规则让模型去死记硬背。”郑嗣寿解释说,因为今年和去年相比,很多企业和行业规则可能已经变了。对于这种动态的、语境化极强的信息,不做通用回答,而是引导用户去思考当下的具体情况。千问选择让AI扮演“辅助者”的角色,在那些AI容易“翻车”的边缘地带,保留了人类的复核机制。
“归根到底,今天整个AI的发展,其实还是AI在学人。但有些地方机器做得比人好,而肯定还有很多地方,机器是不如人的。”蒋冠军表示。在他看来,人类咨询师能做的是“感同身受”,他们有天然的背景知识,这种同理心是天然“对齐”的,这是人比机器有优势的地方。而当用户用Agent来问高考问题时,很多信息其实并没有那么对齐,所以Agent必须采取追问机制,让用户提交资料,尽量做到信息对齐。
那些“非AI”叙事的笨功夫
“坦率讲,我们在高考这件事情上没有竞品。”郑嗣寿说。
但有意思的是,千问在高考领域积累了8年的护城河,其中一项关键工作,其实属于最“笨”的数据清洗。据郑嗣寿透露,千问内部有一个数据团队全年都在做高考相关数据,尤其是基础数据和招录数据的校验与补全。为此,他们还投资了一家公司,专门做与高考数据有关的事情。
数据清洗有非常多苦活、累活。在高考志愿填报场景里,除了大家都知道的——全国各地高考分数线不是统一公布的,它们散落在各个学校的官网、考试院,甚至是一本本纸质的“大本”里——团队还发现了一些更难解决的问题。
比如,有时候哪怕是标准本上的数据也可能有问题。如果把几年数据累加在一起,就更难了——因为专业改名了,专业做了调整,两个专业合并了……这些边界条件非常复杂。因此,在整个志愿回答里,千问Agent会特别注重溯源机制。这种设计在技术上增加了巨大的复杂度。通常大模型生成回答是一气呵成的,而千问则要求模型在生成每一个数据点时,都要“回头看”,都要绑定一个可信的源头。这相当于给AI套上了一副“脚镣”,让它每走一步都得“有据可查”。
“这是我们在用尽所有的力量去对抗大模型天然的漏洞。如果数据实在太多,或者不同来源有出入,我们的办法是把不同的来源都列出来,展示给用户。”郑嗣寿说。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
菜鸟驿站全面并入淘宝 原系统将逐步停运
菜鸟驿站全面并入淘宝体系,原有运行系统及菜鸟APP将逐步停运。取件服务统一通过淘宝APP入口完成,过渡期间淘系身份码取代原有身份码。此举是阿里巴巴在末端物流层面的进一步统一布局。
三星Galaxy Z Fold 8宽屏规格曝光
三星GalaxyZFold8Wide外屏432PPI、内屏304PPI均创系列新高。内屏4:3比例提升阅读办公体验,支持120Hz刷新率,搭载骁龙8EliteGen5forGalaxy,后置双5000万像素,电池4800mAh,支持45W快充。
中浦院科技前沿大讲堂尤肖虎主讲6G技术与未来产业培育
中浦院“科技前沿大讲堂”第四讲上,尤肖虎院士系统阐述6G技术与未来产业培育。他回顾了1G至5G演进,重点解析6G六大应用场景(全息通信、数字孪生、通感算控融合)和四大发展诉求,强调6G作为智慧内生时代,将重塑工业互联网、自动驾驶等底层逻辑,成为数字经济底座。
海力士两倍做多ETF高开超8%
今天港股市场有个很有意思的现象。南方两倍做多海力士这只产品,开市就跳空高开超过8%,势头相当猛。 这背后的直接推手,来自韩国市场的联动。你猜怎么着?SK海力士在盘中上演了一出惊天逆转——本来一度跌超4%,结果硬生生被拉回水面以上,最高甚至冲到了涨超5%的位置。这走势,堪称刺激。 从跌4%到涨5%,等
艾石头星旋磁轴键盘上市 394元起精度0.001mm
近年来,磁轴键盘市场的发展速度令人瞩目,从早期的小众尝试,到如今各大品牌纷纷在精度与参数上展开激烈竞争。近期,艾石头MG75V2已在京东等平台正式上架销售,定价策略颇具巧思,一口气推出五种配色:阳极银、阳极黑、阳极红、落日白橙以及樱花粉白。 价格区间设置较为宽泛:阳极银首发价394元,阳极黑424
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
10
相关攻略
2026-06-11 13:10
2026-06-11 13:10
2026-06-11 13:10
2026-06-11 13:10
2026-06-11 13:09
2026-06-11 13:09
2026-06-11 13:08
2026-06-11 13:08
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

