夸克生成千万份志愿报告背后:一个Agent应用“深度落地”的真实样本
这个夏天,一个数据不仅在AI圈内引起了关注,更牵动了千万中国家庭的心:不到一个月,超过1000万份详尽的高考志愿报告,由一个具备深度研究能力的Agent免费生成。这不是一次技术演示,而是一项直接关系到未来的高风险服务。提供这项服务的,是阿里的夸克。在一次内部技术沟通会上,夸克算法负责人蒋冠军将志愿报告定义为“是夸克深度研究技术的一次重要实践”。这引出了一个值得探讨的问题,当许多AI应用还停留在看似万能但可能不可靠的阶段时,夸克是如何在一个零容错的场景里,实现大规模深度落地的?它的实践,为我们提供了一个观察AI如何从玩具走向工具再进化为智能助手的真实样本。用户具体是如何与这个Agent互动的呢?过程十分简单,用户输入分数等基本信息后,用日常说话的方式告诉Agent自己的想法,比如想去哪个城市、对什么专业感兴趣。Agent随后会生成一份包含完整志愿表的深度报告。用户可以反复修改想法,多次生成报告,夸克方面提到,有用户甚至生成了一百多份报告来辅助决策。1、Agent如何成为一个“靠谱”的决策顾问?每年高考后,志愿填报的复杂性都会被重新讨论。近3000所高校、超过2000个专业,构成了一个巨大的信息迷宫。近几年,随着“张雪峰”等志愿填报专家的走红,也反映了市场的核心痛点,考生和家长缺的不仅是信息,更是一个能帮忙做复杂决策的可信顾问,这也催生了一个鱼龙混杂的志愿填报服务行业。AI能成为这个顾问吗?蒋冠军的看法很坦诚,“当前这个阶段,AI肯定是替代不了考生自己的决策”。那么,夸克要做的,或者说AI现阶段能做到的是什么?答案或许不是替代,而是成为一个靠谱的辅助决策系统。所谓的靠谱,体现在它如何处理现实世界中那些模糊、甚至矛盾的复杂需求上。比如,当用户的理想与现实冲突时。一个常见的需求是“想留在本省的好城市,但分数只够得上外省的985院校”。一个简单的工具可能会陷入逻辑死循环,但夸克的Agent会尝试像真人顾问一样权衡,它可能会主动拓宽选项,为你展示“省外985”和“省内顶尖211”各自的利弊,将决策权交还给你。更有挑战性的是当用户的需求本身就自相矛盾。夸克高考算法负责人唐亮提到了一个典型场景,“数学成绩差,但想报考计算机”。这背后是学生对专业要求的不了解。此时,一个负责任的Agent不应盲目执行指令,而是会触发一个需求澄清流程,温和地提示其中的风险,并引导用户探索更适合的选项。处理复杂场景的能力让AI从一个冰冷的执行机器,向一个能与人商量、值得参考的顾问角色迈进了一步。而要实现这一切,靠的不是单一的模型技巧,而是在后台,一套笨重但扎实的系统工程。1、“笨功夫”与“精细活”“信任”是Agent在严肃场景落地的基石。夸克构建信任的方式,可以归结为两种,一种是下笨功夫,另一种是做精细活。笨功夫下在了数据上。夸克做了几件脏活累活,他们搜集了8657个权威站点进行分级,将超过10万份PDF、Word等非标内容数字化,并组织上百人团队对关键数据进行人工校验,以确保准确率达到“4个9”(99.99%)的水平。这些工作听起来没有算法那么炫酷,但它们共同构成了一个高可信度的知识库,是模型能做出正确判断的前提。而精细活则体现在模型的调校上,必须为其注入垂直场景的灵魂。夸克为此设计的训练范式,层层递进:整个过程始于SFT(监督微调),让模型学习上万条真实专家的推理逻辑,学会像专家那样去分析问题、组织语言。在此基础上,利用RLVR(可验证奖励强化学习),针对有标准答案的事实性问题进行自动化校验,这就像给模型配备了一个24小时的事实核查员,大幅降低“幻觉”。而对于没有标准答案的开放性问题(如专业前景),则通过RLHF(基于人类反馈的强化学习),引入大量真实专家对Agent生成的方案进行打分,让模型的“品味”和“策略观”向人类专家看齐。正是这套笨功夫加精细活的组合,让Agent的决策不仅基于概率,更基于经过治理的、可信的知识与经验。1、一次成功的Agent实践,与它背后的七年夸克志愿报告的成功,是在一个垂直应用场景的胜利。但在更深的层面,它更像一次路演,展示了深度研究技术落地的一种可能性。今天的AI行业,并不缺少聪明的产品。许多大模型应用能写诗、绘画、写代码、做复杂的逻辑推理,但在单个具体任务上,却往往缺乏稳定和可信赖的表现。用户很难将一项严肃、高风险的决策工作完全托付给它们。夸克的选择似乎有些逆流而动。它没有去盲目追求一个无所不能的通用助手,而是像一位手艺人,选中了高考志愿这块硬骨头,并投入了长达七年的时间去打磨。其核心,是一种被夸克称为“深度研究”的方法论。所谓的深度并非仅指技术,更指一种能力。它体现在对场景的深刻理解上,团队没有把志愿填报看作一个简单的概率预测问题,而是将其视为一个信息搜集、自我认知、未来规划高度交织的复杂决策系统。它也意味着对数据的极致治理,团队选择了一条更艰难的路——投入上百人力去做数据的线下搜集和人工校验,以此来构建Agent可信度的地基。此种深度最终落实在对模型的精细对齐上,基于海量专家数据和用户真实反馈,夸克团队不断对模型进行强化学习,让它从一个概率机器逐渐成长为一个懂得权衡、善于沟通的决策伙伴。“志愿报告是我们对深度研究技术的一次重要实践,”蒋冠军的这句话很关键。高考场景,以其极高的复杂度和零容错的要求,成为了这套深度研究方法论的最佳试炼场。如今,这场高难度的路演结束了,夸克也已经推出了面向所有人的通用深度研究功能。这并非简单的功能上新,而是将那套经过千万次高压测试后被验证有效的方法论,开放给了更广泛的用户。它让普通人处理复杂信息、进行深度分析时,也能拥有一个专家级的Agent助手。1、从解决一个真问题开始在关于AI的讨论中,我们听过太多关于颠覆和革命的宏大叙事。但夸克的故事提供了一个更朴素的视角,AI的价值,或许始于脚踏实地地解决一个真实的、具体的问题。它不追求成为无所不知的神,而是努力成为一个在特定领域靠谱的专家。它没有因为技术的复杂而忽视最根本的用户需求,也没有因为商业回报的不确定性而放弃对信息普惠的坚持。事实上,夸克已经连续7年为高考生和家长提供全免费、无广告的高考信息搜索和志愿填报服务。这意味着夸克并非AI浪潮下的投机者,而是将技术落地为社会价值的长期主义者,也让今年的Agent应用更像是一场厚积薄发。超过50%的用户来自三线及以下城市,以及深入乡村的公益行动,都让这项技术多了一份温度。或许,未来真正能改变我们生活的AI,不是那个在云端不断刷新性能分数的庞然大物,而是一系列像夸克志愿报告这样,专注、深入、并真正融入我们工作与生活场景的Agent助手。夸克的高考故事,可能只是这个新篇章的开始。