在广东交通集团运营的8181公里高速公路网络中,数百万台机电设备如同神经末梢般密集分布,每日持续产生TB级的多元感知数据,这些涵盖摄像头影像、雷达信号、气象参数及ETC交易记录等的物联数据,共同构建起智慧交通的“数字『神经系统』”。
然而,值得注意的是,这些数据的业务价值呈现显著的非均衡特征:既有设备正常运行和常规路网状态下产生的低价值密度“沉默期数据”,也包含突发事件下的高价值密度“爆发期数据”。这种特性对传统数据处理模式形成双重挑战——既要化解沉默期数据带来的存储与传输压力,又必须确保爆发期数据能够被实时捕获并高效分析。
根据交通运输部“构建泛在感知体系,推动边缘计算与云平台协同”的战略要求,以及参考国家能源局颁布的《Q/GDW 12120-2021 统一边缘计算框架技术规范》,广东交通集团作为全国首个高速公路硬件服务化省级实践单位,构建了“云—边—端”协同物联体系。
该体系通过打造“端侧轻量化接入、边缘智能化决策、云端集约化调度”的三级架构,以物联网中台为核心,深度融合边缘计算与数据治理技术,进行“数据压缩—蒸馏—异常检测”的全流程计算引擎研究。这套针对物联数据的边缘计算“炼金术”,通过边缘节点预处理降低传输量,结合智能算法提炼关键信息,实现异常事件的快速响应,为公路交通『数字化』转型提供可复制的技术解决方案。
图1 物联网“云-边-端”体系及边缘计算节点架构
01
数据压缩:为传输通道“瘦身减负”
边缘计算通过无损 + 有损混合压缩策略,在不影响关键信息提取的前提下,大幅降低传输压力。
1.1
无损压缩
图2 霍夫曼编码应用技术原理图
LZW 算法则成为静态场景压缩的利器。例如在高速公路隧道监控中,对无车时段的静态背景,边缘节点通过建立背景字典,仅传输变化区域数据,可以使视频流带宽大幅下降,同时保证车辆闯入等事件的完整记录。
1.2
有损压缩
有损压缩目的是在数据精度与数据分析效率之间找平衡,对于交通监控视频、气象监测等可容忍局部细节损失的场景,离散余弦变换(DCT)与小波变换成为核心技术。
DCT 通过将图像从空间域转换至频率域,保留低频轮廓信息并舍弃高频细节,使车流视频压缩比达 10:1,这与 “视频流媒体服务” 的多路分发需求相匹配,确保省级平台在汇聚全路网视频时的高效性。
小波变换则在气象数据处理中发挥独特价值,通过多尺度分析可将 15 分钟能见度采样数据压缩为 3 个关键特征点(突变时刻、峰值、恢复点),数据量降低却完整保留团雾演化过程。这种技术支撑了 “全天候通行保障”的业务场景,为动态交通管控提供精准的气象输入。
图3 有损压缩在高速公路场景的应用效果图
02
数据蒸馏:从海量数据中萃取 “黄金信息”
虽然数据压缩有效减少了数据的体量,但压缩后的数据中仍可能包含大量无关信息、冗余内容或噪声。数据蒸馏的目的,就是对这些压缩过的数据进行更深层次的“提纯”,从中萃取出价值更高、更关键的信息。
这个过程类似于原油提炼:原油经过初步处理去除杂质后,还需要通过蒸馏工艺提取出可直接使用的汽油。数据蒸馏也是类似的“精炼”——它专注于保留数据的核心特征,同时剔除冗余和无意义的成分。最终,数据蒸馏产出一个高度精炼的数据集,为后续的数据分析和决策奠定坚实、高质量的数据集。
图4 从海量数据中蒸馏萃取 “黄金信息”
2.1
日期分隔
通过设定时间范围实现数据分层管理。例如在高速公路车流量监测中,系统优先保留最近一周的实时数据以支撑动态决策,同时将历史数据归档用于长期趋势分析。该方法既保障了分析的时效性,又通过保留足够历史数据为交通流量变化规律研究提供基础。实际应用需注意时间范围的动态调整,如节假日或突发事件期间应适当延长关键数据保留周期。
2.2
阈值设置
基于业务目标构建数据筛选规则。在车速与能见度监测场景中,通过预设车速上限(如120km/h)与能见度下限(如200米),系统可自动捕获超速或低能见度事件数据。该方法的实施需结合天气、时段等变量建立动态调整机制,例如雨雾天气应降低能见度阈值并加强预警触发频率。
2.3
特征工程
特征工程是通过技术手段优化原始数据,构建或筛选出更贴合分析目标的有效特征,从而提升模型性能的关键环节,主要包括特征选择与特征提取。特征选择聚焦于从原始特征中保留关键变量,剔除无关冗余特征。
例如在高速公路事故预测中,可能保留车流量、车速、天气等核心因素,剔除坡度、平整度等次要特征,以简化数据并提升预测精度。特征提取则通过数学变换实现高维数据降维,提取核心信息。如对车辆图像数据,主成分分析(PCA)可提取车辆轮廓等低维特征,减少计算量;线性判别分析(LDA)则能提取区分车型的关键特征,提高分类准确性。两者均通过优化特征表达,增强模型对数据本质的捕捉能力。
03
异常检测:为智慧高速装上 “智能预警雷达”
图5 设备异常检测和业务异常检测
数据异常的表现形式可分为三类:点异常是单个数据点显著偏离正常范围(如图6左侧所示),例如畅通路段车辆瞬时速度突增至 160 公里 / 小时,远超道路限速。
上下文异常表现为特定时空环境下单个数据点的异常(如图6中间所示),如凌晨 3 点偏远山区高速路段出现密集车流,虽然速度正常但流量异常。集合异常是一组连续数据点呈现整体趋势或关联性异常(如图6右侧所示),例如某路段 10 分钟内平均车速持续下降且车距同步缩小,这预示着拥堵风险;又如某区域多个关联传感器,包括线圈、摄像头等同时中断数据,这暗示着区域性故障。
图6 三种数据时序异常表现形式
异常检测主要包括如下方法:
3.1
基于统计的方法
3.2
基于距离的方法
3.3
基于密度的方法
3.4
基于机器学习的方法
3.5
时空特征优化
让异常检测更懂交通规律,主要包括如下方面:
(1)空间特征方面融入路网结构知识,包括路段拓扑如弯道、桥梁、隧道、长上下坡,设备位置如摄像头、雷达、气象站覆盖范围,以及上下游路段影响。例如弯道路段合理车速与直线路段不同,隧道内信号干扰需独立建模。
(2)时间特征方面捕捉周期性规律,如日、周、季节周期,以及突发模式如事故影响。例如周末晚高峰与工作日流量模式有差异,节假日出行特征会变化。
04
结语
基于物联网中台的边缘计算能力,采用无损/有损双模压缩技术构建数据保真与成本优化的动态平衡机制,通过智能蒸馏算法与多模态异常检测技术,实现海量终端数据的本地化预处理与实时分析。该方案可高效过滤冗余数据并提取关键特征,在降低中心云计算负荷的同时深度挖掘数据价值,有效支撑全天候通行保障、主动交通管控、一站式出行服务、个性化信息推送等业务场景,为智慧交通提供精准、前瞻的数据支撑。
作者信息
邢万勇、吕顺锋:广东省交通集团深度『数字化』项目部




