日前,国家数据局官网正式发布《关于推进行业高质量数据集建设行动的实施方案》,《方案》表明,高质量数据集必须面向预训练、指令微调、强化学习、测评等模型开发全阶段,面向知识库、知识图谱、本体、复杂任务规划、长程推理、人机交互、决策执行等新型智能形态,甚至面向具身智能、真机交互和世界模型等前沿方向开展布局。
青岛交通近日发文,表示其推进高质量数据集已久,并已成功开发相关AI应用。

青岛市交通运输公共服务中心作为青岛市交通运输局的“数字底座”,“十四五”期间承担了交通强国试点任务,率先建成了城市级综合交通运输大数据中心体系。截至目前,公共服务中心打通了行业内部的数据壁垒,汇聚覆盖海陆空铁邮等15个领域500余类动静态数据、数据总量超3800亿条,建立了青岛市交通运输数据资源目录;累计发布和实施10余项数字交通相关标准,涵盖数据接入、基础设施数字化、运行监测等多个环节,初步完成交通运输热线高质量大数据集,形成了全面、准确的数据账本;面向70余家单位共享数据,创新开展“开发式”共享服务,支撑城市运行监测、安全应急、规划建设、绿色环保、营商服务等领域140余个应用场景建设,并绘制数据场景应用图谱,高效实现交通运输数据的“汇聚—治理—应用”工作闭环机制,充分释放数据要素价值,跨部门、跨行业、跨领域的间接赋能应用场景构建。

在争取到国家综合交通运输平台部省市联动试点后,青岛市交通运输公共服务中心同步启动交通运输行业高质量数据集建设,加速推进相关工作,顺应人工智能加速向行业渗透,从对话向多模态生成、决策执行、具身智能、物理交互等范式跃迁的趋势。
一是部署强基扩容,建设交通高质量数据集。高质量数据集建设以质量为基、安全为本,通过开展数据质量“铁标尺”行动、数据安全“防护网”行动,明确数据质量评估指标近千个,提升数据质量抽检频度,同时形成数据安全分类分级体系,强化加密脱敏及授权访问管控,让人工智能大模型精准用数、安全用数。
二是实施应用赋能,大力推进人工智能+交通。以业务实际需求为驱动,围绕热线人工智能转办,构建面向热线智能体的样例数据高质量数据集,并完成综合交通每日运行监测11类数据的高质量数据集AI应用测试,为相关智能体的建设提供关键支撑。下一步将围绕交通运输辅助决策、运行监测、公众出行等领域,形成更加全面的智能服务体系。
三是实施价值释放,持续推进交通数据要素交易。推进在省公共数据平台上的公共数据确权登记,累计在国家及省平台上完成登记15项。推进交通运输公共数据的市场化拓展,赋能城建规划选址、金融服务产品等场景,进一步释放数据价值。