餐饮外卖今后最大的亮点或许不再是烧钱和补贴了,若干年后具身智能机器人将成为重塑外卖产业效率乃至整个餐饮业的关键。
6月17日,国家市场监督管理总局发布《外卖平台补贴行为规范十条(征求意见稿)》,为持续多年的外卖补贴大战正式划下红线。
的确,长期以来餐饮前端的价格厮杀备受关注,可鲜为人知的是,后端的效率改变同样正在发生。时下,一批从互联网大厂走出的技术团队,把目光投向了烟火气最浓的餐饮后厨,试图用“世界模型”重构这条最依赖人工的产业链。

我们认为,具身智能在未来餐饮产业链的价值,不再仅仅是送餐机器人那般简单,它会深入到餐饮行业最复杂的环节中去,并带来积极影响。
那么,从线上算法到物理世界的跨越,具身智能在餐饮行业的落地,究竟是下一个万亿赛道的起点,还是又一个技术理想主义的试错?
不妨让子弹再飞一会儿。
01.
比后厨机器人更惊艳的是餐饮世界模型
回过头来看外卖行业过去十年的竞争,本质上还是流量与补贴的博弈。平台用真金白银换用户规模,商家用低价换订单排名,整条链路的数字化都围绕“线上交易”展开,例如,点餐系统、调度算法、用户画像、商家SaaS,每一轮技术迭代都发生在屏幕里。
可直到订单量冲到日均数千万级,人们才发现,整条链路最脆弱的环节,实际上在后厨里。打包慢了、出餐错了、封签漏了,前端算法再精准,到了物理世界这一环照样卡壳。
相比后厨端的具身智能产品,多年来已经广泛落地的酒店送物机器人、餐厅传菜机器人,大多还停留在移动层面,只能完成点对点的运输任务,碰不得真正需要动手操作的复杂餐饮流程和作业工序。
拐点发生在近一两年。机器人终端产品侧,此前方太已经发布机器人厨房,搭载“成长型”厨房具身智能系统,由异构机器人矩阵构成:高精度机械臂负责杯具定位、接水乃至精细的洗碗机餐具摆放;人形机器人则完成倒油、翻炒、盛菜等复杂烹饪操作。从烹饪到清洁,全链路实现无人化作业。

无独有偶,不停科技推出的智能烹饪机器人,作为其数字厨房解决方案的核心,凭借多维传感技术,机器人能够全自动、精准调控温度与调味,并搭配自动清洗、出菜、智能语音等6A自动化功能。

不过相比上述这些后厨物理终端,外界更关注的,是后厨机器人的物理模型。
如何理解餐饮赛道的世界模型?
我们可以想象下,假设一家公司不做人形机器人,直接锚定餐饮场景打造世界动作模型。其在技术路线上走视觉-触觉融合路径,目标是要让机器人既能看懂后厨环境,也能感知物体的软硬、轻重、温度,优先落地外卖打包、出餐接驳这些高频痛点环节。
在一些业内人士看来,VLA路线过度依赖语言模块进行高层规划,但真实世界里的动作控制,本质上并不依赖语言。因为人类真正的动作控制路径,其实没有那么强依赖language。更核心的问题,是视觉理解、物理理解,以及动作如何与真实世界建立映射。

换句话说,搞餐饮世界模型的这帮人,从实验室走出来找场景的团队有所不同,他们带着一肚子行业痛点下场创业。外界看到的是“机器人能不能打包”的技术问题,他们看到的是“高峰期每单打包快三秒,整条配送链路能提升多少效率”的全链路问题。
技术架构层面,目前业内领先的系统大致分为三层。最上层是具身世界模型,用于形成对后厨环境的认知,并完成决策与动作规划;中层是任务编排与调度引擎,将认知结果转化为具体执行计划,并统一调度不同设备;底层则是自研核心部件与通用硬件本体的融合,确保系统能够在真实后厨长期稳定运行。如果能在一个足够高频、足够痛的场景里持续收集真实交互数据,反过来喂养世界模型,是足以让模型在物理世界中越来越聪明的。
通俗地理解就是,餐饮世界模型在逻辑上是把先想再动”能力搬进后厨,即,预判汤碗会不会洒、包装袋会不会破、多订单并行会不会撞手,在动态变化的物理环境里做出连续决策。这一步一旦走通,意味着人工智能第一次从数字世界真正踏入了烟火气十足的物理操作场景。
02.
餐饮世界模型的市场蛋糕会有多大?
判断一个垂直赛道的价值,都得先看底盘够不够厚,再看病痛够不够深。餐饮这条赛道,两者都站得住脚。
国家统计局数据显示,2024年全国餐饮收入达5.57万亿元,同比增长5.3%,增速跑赢社会消费品零售总额1.8个百分点 。红餐大数据显示,同期全国餐饮门店总数接近800万家,行业经营主体超过千万量级 。
作为一个体量庞大的基础产业。目前产业至今仍高度依赖人力,中国饭店协会数据显示,连锁餐饮品牌人工成本占营收比重普遍超过25%,部分正餐品类后厨人力占比更高。
且比成本高更棘手的是招人的困境,餐饮行业人员流动率常年居高不下,后厨岗位工作时间长、环境闷热、重复性劳动强度大,年轻人入行意愿持续走低。
与此同时,数字化留下的空白地带也是客观存在的。过去十年,餐饮业的前端已经被彻底数字化:顾客扫码点餐、商家后台接单、平台智能调度、骑手路径规划,每一步都有数据、有算法、有系统。
然而唯独后厨操作这一环,至今高度依赖人工经验,例如,备菜多少凭手感,出餐快慢看状态,错单漏单、食材损耗、出品不稳定,这些问题直接影响整条链路的效率,却一直没有系统性的技术解决方案。餐饮世界模型要填补的,正是这最后一块数字化拼图。
客观而言这套模式其实还有一层容易被忽略的优势:全球化复用性。
举个简单的例子,中餐后厨和西餐后厨细节不同,但打包、分拣、出餐这些标准化操作的底层逻辑全球共通。模型理解了物理世界的动作规律,换个菜单、换种包装都能快速适配,不需要从零开始重建。这意味着它的市场边界不止于国内800万家门店,而是可以向外延伸到全球餐饮市场。对于技术公司来说,这是从本土生意到全球生意的想象空间。

从产业规律看,一个行业的数字化总是从最容易标准化的环节开始,逐步向复杂环节渗透。餐饮业走完了前端交易的数字化,走完了调度配送的数字化,下一站必然落向后厨生产环节。只是方向对了,不等于路就好走,真正的考验,才刚刚开始。
03.
赛道瓶颈突出,难复刻互联网爆发路径
后厨场景被视作具身智能落地最确定的垂直赛道之一,资本和技术团队正持续涌入。但越是热闹的时候,越要看清现实的边界。这条赛道有长期价值,却很难复制移动互联网时代那种快速起量、一家独大的爆发路径,其中有几道坎,短时间内绕不过去。
第一道坎在技术本身。
由于真实后厨不是实验室,环境永远在动态变化——台面有水渍、包装袋有褶皱、餐品温度不一样、订单高峰时台面堆满东西。实验室里成功率99%的抓取动作,放到真实后厨可能连80%都达不到。商用场景对稳定性的要求远高于演示场景,一次漏撒、一次错单,就可能影响商家对整个方案的信任。
考虑到物理世界的数据积累速度,远慢于数字世界,每一个动作、每一次交互都要在现实中发生,没法靠算力暴力堆出来。

商业回报是第二道门槛。
众所周知,餐饮行业是薄利生意,多数门店净利润率只有几个点,商家对投入产出账算得极细。一台设备多少钱、能顶替几个人、多久能回本、故障率高不高、维修方不方便,每一个问题都是硬指标。
这个特征意味着它不像To C互联网产品可以先免费再变现,To B的自动化方案从第一天就要算清经济账。这就决定了市场教育周期会很长,商家决策链会很慢,很难靠烧钱快速铺开。
场景标准化则另外一个难题,800万家门店看起来是个大数字,但门店和门店之间差异极大,连锁品牌和夫妻店不一样,快餐店和火锅店不一样,中央厨房和街边小店也不一样。
倘若没有统一的后厨标准,就意味着模型很难一套方案打天下,每个品类、每种店型都要做适配。场景碎片化,会直接拉低规模化复制的速度。
所以餐饮世界模型这条赛道,长期看空间充足,短期看需要耐心。但谁都没法跳过试错、迭代、落地、再迭代的循环,也没法靠一个算法就通吃整个市场。
餐饮市场多年以来被移动互联网改变了经营模式、盈利结构和服务方式,可流量红利见顶之后,玩家都要回到效率这个问题。而后厨的机器人浪潮,本质上是餐饮业从拼流量转向拼技术的一个缩影。
下一个十年,决定餐饮行业格局的,可能是谁的后厨跑得更快。