2026年1月15日,AI迎来一次新的重要变革。
当天,千问App上线400+项新功能,并全面接入淘宝闪购、支付宝、淘宝、飞猪、高德等阿里生态。
更重要的是,它把“推荐—下单—支付—履约”拉进同一个应用里:用户在千问App内即可点外卖、买商品、订机票、订酒店,成为全球首个实现 AI 超级应用(Super App)内闭环的案例。

这意味着,阿里AI的“最强大脑”开始与物理世界的“最强履约”合体。千问App不再只是能生成代码的聊天机器人,而是第一次长出了“手脚”:能把需求直接变成交易与交付,向“AI办事时代”迈进。
全球AI竞赛的焦点,也在从“谁的模型更聪明”,迅速转向“谁能更完整地履约”。
千问C端事业群总裁吴嘉与华尔街见闻对话时表示,AI真正的分水岭不在于模型能说的多漂亮,而在于能否在复杂场景里完成交付:简单问题就简单回答,复杂问题就要多轮沟通、把需求校准到位。
从去年的淘宝闪购,到今天的千问Super App,阿里在大消费与 AI 两条战线的“聚合趋势”越来越清晰:各业务不再各自为战,而是围绕同一个AI入口协同作战。由AI作为粘合剂,也将有望带动阿里所有资产一起实现AI重估。
千问App把AI拉进真实履约,再次彰显阿里“最强模型+最丰富生态”所具备的竞争优势,更不断向外界证明:不论算力基建、模型能力,还是AI购物等应用落地,阿里都全面领跑,不愧是中国AI第一标的。
当AI长出“手脚”
1月15日,阿里正式宣告AI从“聊天”迈入“AI办事时代”。
用户在屏幕这端抛出一个模糊意图,千问在云端调用Qwen3-Max的推理能力,拆解任务、编排工具:调淘宝的商品库,算高德的路径,唤起支付宝的支付与资金流。
最终,结果以真实的包裹、热腾腾的外卖、合适的机票,抵达用户的物理世界。
来看一个场景:用户对千问说,“我是个菜鸟,想去东北滑雪,给我推荐合适的装备。”
在旧逻辑下,用户往往只会得到一堆攻略:夹杂软文、信息过期,还得自己分辨、自己上淘宝搜、比价、下单,链路割裂,摩擦极高。
在千问的新逻辑下,“菜鸟”意味着更高容错、更易上手;“东北”意味着更高保暖、更强防风。
千问不仅给建议,更能基于淘宝的商品库与评价体系,生成可执行的具体选品方案:用户在千问内看详情,一键跳转下单,中间几乎没有断点。
更进一步,打通淘宝闪购后,千问在端内即可完成“推荐—点单—支付”。用户不必再打开外卖App,也不需要在满减券里算数学题,AI直接帮你决策、下单、付款,接入支付宝之后,千问具备了AI原生支付能力,体验的跃迁是质变。千问成为真正意义上全球第一个可以购物的AI。
然而购物只是能办事的一部分,它甚至能调用支付宝的政务能力:一句话查询签证、户口、公积金等约50项民生事项,并直达办理入口。与此同时,千问在应用开发、Office 办公、学习辅导、咨询调研等300+核心任务上,已经具备很高的交付成功率——从“给答案”走向“交结果”。
吴嘉在对话中提到,生活场景里用户往往并不掌握自己的“真实需求”,必须通过多轮确认来对齐偏好:你没看到具体方案前,很难判断“是不是我要的”。这正是Agent该做的事。
这些能力看似琐碎,本质上是在构建一个“生活OS”:AI是内核,淘宝、支付宝、高德等是驱动,物理世界的服务是外设,通过Agent把它们串联起来。
只有阿里,拥有足够完整的“驱动程序库”。
OpenAI没有这套库,谷歌不够完整,亚马逊也不对外开放——这就是阿里真正的优势所在。
最强“大脑”
任何商业闭环都要有强技术底座。只有“手脚”没有“大脑”,最多是自动化脚本,不是AI Agent。
吴嘉强调,团队不刻意追逐“人均对话轮次”这类指标,衡量标准只有两件事:用户真实需求的满意度与交付率——简单问题就简单回答,复杂问题就多轮沟通,把需求校准到位再交付。
阿里在模型层的投入很坚决。
Qwen3-Max作为核心底座,性能位居全球第一梯队,千问作为全球最具影响力的开源模型之一,也被英伟达、Airbnb、亚马逊等硅谷公司与开发者广泛采用,成为“最好用的开源模型”代表。
架构上,千问App采用通用Agent体系:主Agent负责拆解与规划,具备反思能力的子Agent在各自领域独立决策执行,任务结束后系统复盘沉淀经验,推动Agent持续升级。
这也呼应吴泳铭的判断:ASI演进进入第二阶段——AI从“语言交流”走向“自主行动”,不止会说,更能把事办成。
还原数据“场景真相”
大脑决定“能不能办”,但在Agent 时代,真正决定用户是否愿意把关键决策交出去的,是“办得准不准”。
AI Agent的核心痛点是信任与准确。
大模型基于全网语料训练,天然夹杂噪音:软文、广告、刷单评论、SEO 文章。用户问“什么面膜最好用”,得到的答案可能只是某篇付费通稿的复述,看似有理,实则不可核验。
阿里的解法更“硬”,用海量真实交易与服务数据构建可验证的“场景真相”。每天发生在淘宝上的真实交易,都是货币投票;经过反作弊清洗后的好评与差评,就是信用沉淀。
千问App用这套数据增强模型,让它不仅依赖世界知识,也依赖可落地的商业常识。
当AI推荐一块滑雪板,它不看文案吹得多响,而是看过去一个雪季的真实购买、退换、复购与口碑分布。剥离软文与广告,就剥离了“种草营销”的伪,从源头提升输出的客观性与稳定性。
这种“场景真相”很难被复制。
OpenAI的公共数据源(如Common Crawl)更容易被SEO噪音污染,即便通过媒体合作补充高质量语料,新闻语料与交易数据之间仍有量级差异。
商业数据壁垒来自源头与闭环,谁掌握交易与服务的入口,谁更接近“真实世界的答案”。
这恰恰是阿里二十多年生态积累的优势,也解释了为什么在海外,巨头们往往需要用“协议”和“联盟”去补齐履约:路径不同,成本与不确定性也不同。
谷歌与OpenAI的困局
在大洋彼岸,谷歌也在行动,焦虑显而易见。
1月11日,谷歌在NRF大会上发布通用商业协议(UCP)。
谷歌有全球最大的流量入口,但在电商履约上始终缺一条腿:亚马逊护城河太深,OpenAI来势太猛,谷歌必须把盟友拉进同一套体系里。
UCP 的思路是“协议化”:用通用语言与功能原语,把AI Agent与商家后台系统对接起来,于是Shopify、Etsy、沃尔玛、Target等被拉入阵营。
尤其是沃尔玛。
谷歌与沃尔玛的合作更像“互补”:沃尔玛需要流量对抗亚马逊,谷歌需要货盘与履约对抗OpenAI。但协议的天然问题在于松散:数据是否会完全共享?库存是否会实时开放?
零售商对谷歌始终有戒心,没人愿意把自己变成“谷歌的管道”。
所以,谷歌走的是“借路”:靠协议与盟友拼出闭环;而阿里走的是“自建路”:用自有生态把闭环直接铺在App里。
再看OpenAI。
它点燃了这场革命,但未必是最终赢家。ChatGPT推出“即时结账”(Instant Checkout),试图把Chat拉到下单闭环里,可它仍面对一个物理现实:有大脑,缺手脚。支付、物流、商品与服务供给不在自己手里,履约只能依赖他人,体验割裂。
于是它不得不与Shopify、Stripe等结盟:靠Shopify的商家供给,靠Stripe的支付能力。这是一种“借鸡生蛋”,风险在上游:一旦关键平台收紧数据与接口,“全网搜索”会迅速变成“局域网搜索”,闭环覆盖面也随之收缩。
对消费者而言,如果主流货盘不开放,Instant Checkout的可用性就会被天然限制。
对照之下可以看到:闭环不仅是技术拼图,更是组织与生态的拼图。能否把入口、数据、履约拧成一股绳,决定了能不能长期跑下去。
阿里的再一次组织变革
资本市场习惯把阿里归类为电商公司或云公司。但在智能体商业(Agentic Commerce)时代,估值框架需要重构:入口、履约与数据真相共同决定AI的交付上限,也决定商业化的天花板。
千问App的全面接入各业务线,正是阿里组织战略的一面镜子。
过去几年,各业务板块相对独立,利于单点突破,但进入AI时代,它反而成了掣肘——AI需要全域数据,也需要跨端能力的协同调用。
自“淘宝闪购”推出以来,风向开始转变。
饿了么与淘宝闪购的融合,是大消费领域的生态聚合;千问App的接入,则是AI领域的生态聚合。阿里正在把全集团的力量拧成一股绳,这一次的粘合剂,是AI。
淘宝闪购在其中扮演关键角色,它把电商与即时零售连接起来,让“点外卖”这个高频动作进入淘宝,也进入千问。对千问而言,打通闪购后,推荐、点单、支付形成闭环,才真正具备“能办事”的履约链路。
淘宝是货架,支付宝是钱包,高德是地图,飞猪是向导——这些沉淀多年的商业基础设施,过去更多是线性增长。在AI带动下,它们开始被拆解为可编排的“原子能力”,可以被高频调用、灵活组合,衍生出更多服务形态。
这既是价值的回归,也是价值的跃升,当一家公司同时掌握数字世界的“大脑”(Qwen3-Max)与物理世界的“手脚”(淘宝/支付宝/闪购等),它就不再只是若干App 的集合,而是连接两个世界的桥梁——这种桥梁的价值,远高于单点应用的叠加。
结语
到了2026年,AI开始变成生活本身。
AI不必花哨,关键是把事办成、把交付做到位。这是AI时代的必然:谁把大脑接上手脚,谁就更接近未来。
*以上内容不构成投资建议,不代表刊登之观点,市场有风险,投资需谨慎,请独立判断和决策。