张毅:交通大模型范式探究与服务应用实践_商超零售

张毅:交通大模型范式探究与服务应用实践

创始人

2026-05-20 15:21:57

编者按：在第十六届（2026）智能交通市场年会--人工智能+交通运输应用技术及产业发展论坛中，清华大学教授、中国人工智能学会（CAAI）会士、智能交通专业委员会主任张毅，作了《人工智能赋能交通运输服务--交通大模型范式探索与服务应用实践》主题报告。

围绕交通大模型应用落地，张毅结合行业评审与项目实践，剖析当前交通大模型建设存在的认知误区与应用乱象，系统梳理大模型演进逻辑及在交通领域面临的数据不足、公开度低、模型幻觉等现实挑战，提出可落地的交通大模型应用范式，并从认知定位、场景选择、基础深耕三方面给出实践建议，为交通行业科学、有序推进大模型应用提供重要参考与思路指引。

本次报告主要围绕人工智能在交通领域的应用展开，报告结合了近两年来，我们参与的交通行业专家研讨、参与相关项目评审，以及项目组在研究过程中形成的体会总结而成，分享我们在实践与研究中形成的思考与看法。

在人工智能的应用推进过程中，交通大模型正受到越来越多的关注与追捧，交通行业各个业务领域与服务范围都提出了建设交通大数据、构建交通大模型的诉求。但引起行业需要思考的是，交通大模型应该如何正确使用，如何真正落地应用。

在参与项目评审的过程中，我发现了许多此前未曾预料到的问题。举个简单例子，国内某规模较大城市的交警部门，希望我以行业专家的身份，对他们近期委托企业开发的基于交通大模型的信号控制系统进行评估。

我与相关团队进行了深入的交流与分析，最终发现，该系统仅仅采用了神经网络技术实现单点信号控制，远未达到多点联动控制的水平，却被定义为应用了交通大模型的系统。进一步深入核查其数据来源与数据构成后发现，其所使用的数据，并非我们所认定的大模型应用所必需的标准数据。基于这一系列现实问题，促使我们必须思考：在交通行业中，交通大模型在实际应用时应当遵循哪些范式？

交通大模型服务应用需求分析

大家所熟知的语言大模型（LLM），自 2017 年谷歌提出首个 Transformer 架构后，经过多年技术迭代发展，到 2023 年正式进入语言大模型发展元年。截至目前，据不完全统计，全球范围内已发布且可公开查询到的大模型数量已接近一千个。从整体分布情况来看，中国占据主要份额，相关数据显示占比达到 50% 至 55% 左右，位列第二的是美国，占比 40% 至 45%，其他所有国家合计占比不足 5%。由此可以看出，在人工智能大模型的应用与发展领域，中美之间的竞争态势十分显著。

在这样的行业背景下，交通领域需要明确，哪些场景、哪些环节可以应用大模型。

梳理交通部下属各研究院提出的应用需求，交通行业可应用大模型的方向主要归纳为以下几类：

一是交通管理与优化，其中包括前面提到的交叉口信号控制；二是交通安全与风险防控；三是出行服务与体验提升；四是基础设施智能化运维，这是需求极为迫切、应用空间广阔的重要方向，近年来发生的多起重大交通灾害、交通事故，都与基础设施状态密切相关，行业层面迫切希望借助大模型解决当前面临的诸多问题；此外还包括与交通密切相关的自动驾驶、车路协同、绿色低碳可持续发展、行业智库建设以及政策规划制定等方向。

从大模型演进历程看应用挑战

在明确应用方向的基础上，亟需进一步厘清大模型究竟能够在这些场景中发挥怎样的作用。要回答这一问题，我们需要回溯其基础逻辑，即从语言大模型的核心机理出发，理解从基础语言模型到语言大模型的演进过程中核心机理是否发生改变。

在此我可以明确说明，从基础语言模型到成熟的语言大模型，其核心机理并未发生变化。用案例加以说明，这是十年前高一计算机课程中就曾出现的作业题目，其设计初衷是围绕数据结构、数据存储以及数据间的关联关系展开，但其最终呈现的效果，已经体现出当前语言大模型的部分核心特征，语言大模型的最初逻辑正是源于此。

简单来说，这项作业的要求是，老师为学生提供一篇约一千个英文单词的文章，要求学生梳理出所有英文单词之间的相互关联，并通过数据库对这些关联关系进行描述。完成这一任务需要考虑多重问题，其最终目标是，老师从文章中随机选取一个单词，学生编写的程序能够自动生成一句完整的语句，这也是该作业的最终考核标准。

要完成这项作业，首先需要满足几项基本要求：第一，必须符合基础语法规则，例如 I 后面应接 am，而不能出现错误搭配，在构建单词间常规前后关联关系时，必须遵循基础语法逻辑；第二，对于同一个单词，若其后可衔接多个词汇，需要统计这些词汇的出现频率；第三，最初的作业要求中，并未规定生成语句必须具备真实物理意义，仅需满足语法规范即可。这是高一学生可完成的作业，其核心正是构建关系数据库，明确每一个单词与后续单词之间的关联关系。

在这一逻辑下，输入一个单词后，即可从关系数据库中调取对应关联关系，逐步生成完整语句。在关系数据库中，需要建立所有前后相邻单词的关联关系，当前一个单词后仅对应一个单词时，关联关系明确；若对应多个单词，则需要通过合理方式排序，可依据出现频率排序，也可根据语法重要性排序，还可剔除部分无效关联，完成排序后编写程序即可实现语句生成功能。

程序编写完成后，老师随机给出单词即可触发语句生成。这里举两种典型情况，一种是给定明确主体词汇，例如 he、she 等，可依据文章中的词汇关联依次选取第二个单词、第三个单词，以此类推完成语句生成；另一种情况相对复杂，给定定冠词类词汇，例如 the，其后可衔接的词汇种类多且无明确指向，在构建数据关系库时可为其赋予相应权重，进而完成词汇选择，例如输入 the 后，可生成 “The sky is blue” 这样的简单语句。

完成这项作业后，我们可以总结出必须考虑的核心要素：第一，语法不能出现错误，保证能够形成完整语句；第二，语句仅需满足完整度要求，不强制要求具备真实意义；第三，明确语句中所有单词的选取逻辑与生成方式。

从工程学角度出发，我们希望通过数学模型进行描述，学生通常采用最简单的概率方式，即优先选择出现次数多、概率高的词汇，若概率相同则增设判断条件完成筛选，由此即可构建对应的数学模型。从 the 开始，依次确定 the、sky、is、blue 的概率，最终形成完整的概率计算逻辑，这就是用数学模型对作业任务进行的完整描述，也是最初语言模型的核心逻辑。

在此基础上，语言模型还具备多重拓展应用空间：

一是支持多语种应用，不仅适用于英语，也适用于中文，中文大模型也因此具备了发展基础。中文与英文的词汇构成存在差异，中文单个字即可构成独立词汇，无需强制组合成词，语义表达更为精准。

二是拓展上下文关联范围，传统逻辑仅依据前一个单词选取后一个单词，语义连贯性较弱，若结合前文句子、段落内容，增设附加条件优化后续单词的概率选择，生成语句的语义连贯性将大幅提升。

三是具备主题延续能力，在生成一个或多个句语句后，可基于前文确定的主题，持续生成后续语句，由此从简单的语言模型升级为更贴近实际应用的语言模型。

具备这些能力后，语言模型可实现更多应用场景。我举几个简单例子，中学教学中常要求学生模仿鲁迅先生文笔创作散文，难度较高，而将鲁迅先生的作品输入模型并构建词汇关联后，输入提示词即可生成风格相近的语句；在科研工作中，可实现文章摘要自动生成，从大量文献中提炼核心内容。

当语言模型的应用范围进一步扩大，实现全场景、全人群、全领域通用，即可满足无限制提问需求，生成内容符合生活常理、社会伦理与环境要求，同时适配多种写作风格需求，此时语言模型便逐步向通用大模型方向演进。例如展厅内的智能问答机器人，可响应无范围限定的各类问题，这也是语言大模型从基础模型发展而来的重要体现。

发展至今，语言大模型的核心机理并未发生改变，之所以早期无法实现规模化应用，主要受三方面因素制约：一是素材不足，早期仅能输入单篇或数篇文章，无法纳入全球海量文本数据；二是复杂关联关系难以提炼，简单概率模型无法描述人文等复杂关系；三是算力要求极高，海量文本数据输入对算力提出严苛要求。

综上，大模型的基本框架可概括为：基于全球海量文本数据，依托超大算力支撑，训练生成可响应各类问题的语言大模型，其核心是通过词汇关联与概率计算，输出最优结果。

在这样的技术逻辑下，大模型在交通领域应用会衍生出一系列现实局限与落地挑战。其中模型学习效率、计算能力等问题相对容易解决，最核心的制约因素是文本素材的充足性与可用性，尤其是行业层面可获取的成熟、可行的方案数据是否充足、能否直接使用，并非简单搭建大模型即可实现应用。

我再分享一个亲身经历的案例。我曾作为科技部相关领域专家，提出了智能车路协同的概念，我国智能车路协同技术或系统的标准定义，收录于我的专著中，也被交通部采用。按照正常逻辑，使用大模型查询 “什么是智能车路协同系统”，应输出标准定义，但我使用 DeepSeek、元宝等多款大模型进行测试，询问其关键技术时，输出结果均与标准答案不符。我所提出的智能车路协同包含九项体系化关键技术，相关论文引用率较高，但多款大模型均无法给出正确答案。

这一案例源于我在教学中的实践。我曾为学生布置作业，要求总结智能车路协同的定义与关键技术发展情况，第一年不允许使用大模型，却发现有学生完成的内容规范度远超水平，怀疑其使用大模型辅助；第二年我允许学生使用大模型完成作业，最终输出的结果五花八门。

我深入思考后发现，核心原因正是大模型的内在机理所致：当前学术写作需规避查重，研究生、毕业生在引用标准定义时，都会对原文进行修改，导致标准定义在训练数据中的概率趋近于零，大模型最终输出的结果自然偏离标准答案。

这一现象反映出大模型应用中必须高度重视的幻觉问题，在此基础上，大模型还存在诸多局限性与可靠性问题。结合交通行业实际，主要制约因素包括：一是行业数据种类有限，公开度不足，国际通用大模型可依托全球素材训练，而我国交通行业核心数据未完全开放，缺乏数据支撑则无法开展大模型训练；二是数据标准化程度低，各部门大量数据未进行规范化处理，难以直接用于大模型训练；三是数据利用率不足，多重因素共同制约了大模型在交通领域的落地应用。

基于当前技术条件，通用大模型可作为交通领域应用的参考，但需完成大量前置工作，其中数据语义化表征是核心环节，若无法实现数据语义化表征，大模型在交通行业的应用将面临巨大阻碍，这一领域需要持续深耕与探索。

交通大模型范式探究及其内容

基于上述现实情况，我们结合实践经验，提出一套交通大模型专属的应用范式，可供行业参考，并在实践中不断优化、补充、升级。

从大模型基础结构来看，当前主流应用以语言大模型为主，交通领域语言大模型存在固有局限，需要探索更具挑战性的技术方向。理想状态下，依托充足的文本数据完成语言大模型训练后，针对交通应用场景即可直接落地，接收应用请求并生成解决方案，但实际应用中存在诸多现实问题。

当前交通领域数据存在三大核心问题：一是数据总量不足；二是数据公开度低；三是数据缺乏明确表征，企业在应用前若未充分理解数据的物理意义与应用背景，无法直接用于模型训练。要支撑大模型基座建设，必须先完成数据扩增，主要有两种路径：一是依托行业专家经验进行数据扩充，二是基于现有数据提取特征，完成数据拓展，只有数据量达到要求，才能为大模型训练提供有效支撑。

数据基础完善后，仍需对模型进行适配优化。通用大模型为普适化模型，而交通行业大模型需贴合行业专属需求，因此需要剔除与交通应用无关的内容，结合交通细分场景进一步调优模型。模型调优可采用模型蒸馏的方式，提升模型运行效率。同时，交通行业的需求与场景处于动态变化中，政策、标准、工程要求会不断调整，模型并非一成不变，需要根据应用场景开展效果评估，基于评估结果反向调整模型，保障模型的适用性与有效性，由此形成完整的交通大模型应用闭环。

交通领域具有独特的数据属性，除文本数据外，还存在海量视频监控数据，这类数据无法直接通过语言大模型处理。若将视频场景简单转化为文字描述，会造成大量信息丢失。以自动驾驶场景为例，自车周围采用九宫格布局，八个方位可有车辆，若要将其转化为语言大模型可识别的内容，需要用语句描述车辆位置、速度、加速度及行驶意图，视频中的丰富信息会被大幅压缩，大量有效信息丢失，因此完全转化为文本的方式不具备现实可行性。

针对交通领域海量图像、视频数据，我们提出发展视觉大模型，基于视觉信息本身开展语义化描述，而非简单提炼为文本。除此之外，交通领域还存在运力、流量等数字化数据，需要解决多模态数据的标注与融合问题，将文本、视觉、数字等多类型数据有效整合，才能构建适配交通服务场景、经过模型蒸馏、具备明确目标导向的专业化交通大模型。

这就是我们经过研究与实践总结出的标准应用范式。基于这一范式，我们梳理了交通大模型的可落地场景，此前归纳的八大类应用方向中，有五类场景当前已具备落地条件，但需要强调的是，若数据、技术等核心问题未得到解决，应用效果仍会受到限制。由此可见，交通大模型建设不能盲目跟风、全面铺开，需要明确可落地场景与待探索场景，遵循循序渐进的推进原则。

交通大模型服务应用实践建议

最后，结合我们提出的应用范式以及研究、实践过程中的体会，提出三点核心实践建议：

第一，充分认知交通大模型在服务应用中的实际效果，理性看待大模型的能力边界，不要将人工智能与大模型神化为万能工具，明确其能够解决的问题与无法实现的目标，形成客观、准确的认知。

第二，精准选择应用范围与领域，并非所有场景都适合立即应用大模型。当前数据体系不完善、解决方案不成熟的场景，无法通过简单训练实现有效输出；大模型的学习逻辑依赖已有案例，若训练数据以低效、失败案例为主，输出的方案也不具备应用价值，只有基于成熟、成功的案例数据，才能生成有效方案，正如前文机理所述，优质方案若在海量数据中被淹没，便无法通过大模型输出。

第三，持续深耕行业基础工作，投入时间与资源推进数据处理、多模态数据融合等核心工作，夯实大模型应用的底层基础。

单词数据模型服务交通范式张毅行业应用智能语句

上一篇：聊城市东昌府区交通管理大队查获一起小型面包车超员交通违法行为

下一篇：克而瑞好房点评网 | 京投发展·北熙区轨道交通与通勤便利深度解读：双轨交汇+TOD上盖，北京改善盘交通维度绝对标杆

⚠️

本网站信息内容及素材来源于网络采集或用户发布，如涉及侵权，请及时联系我们，发送链接至2697952338@QQ.COM，我们将第一时间进行核实与删除处理。

张毅:交通大模型范式探究与服务应用实践

相关内容

热门资讯