Identification of key cognitive ability factors for metro train drivers based on VTS data mining
-
摘要: 运用维也纳测试系统(Vienna test system, VTS)对354名地铁司机的认知能力进行测评,通过K-means聚类算法对VTS数据进行无监督学习建模,得到司机认知能力分类模型。以Recall值最大为目标函数,对认知能力分类模型进行XGBoost训练和优化,采用SHAP算法对模型中各项认知能力特征指标的重要度进行分析,识别出平均反应时间、正确总数和视野范围三项关键因素以及它们之间的交互作用。研究结果用于认知与应急能力领域,可为地铁司机的遴选、在岗测评和培训提供一种更精确的工具。Abstract: Cognitive abilities of 354 metro train drivers were assessed by using the Vienna test system (VTS). An unsupervised learning model was developed through K-means clustering algorithm on the VTS data to establish a cognitive ability classification model. With the maximum Recall value as the objective function, XGBoost training and optimization were performed on the classification model. SHAP algorithm was employed to analyze the importance of various cognitive ability feature indicators in the model, and three key factors that mean reaction time, total correct responses, visual field range, as well as their interactions were identified. The research results can provide a more precise tool for the selection, on-the-job assessment, and training of metro train drivers when applied to the field of cognition and emergency capabilities.
-
“十三五”以来,我国城市轨道交通呈爆发式快速增长[1]。地铁司机作为人机环管系统中的关键一环,他们的工作质量和安全性直接影响着城市运行效率和公众利益。地铁司机工作任务所要求的职业能力包括注意力、感知、语言、辨识图形、手眼耳嘴等多重感官协调动作[2]等多个方面,这些能力涵盖广泛的认知领域,包括信息的加工、存储与提取过程,同时也强调紧急情况下的应对能力,以保证司机能够做出快速而准确的决策。
现有研究文献主要集中于司机个体特征分类和认知能力评估,潘雨帆等[3]采用一种综合眼动、心电信号和线路参数时序特征的方法预测高速铁路司机的警觉度。何静等[4]采用多种心理学测量工具,包括压力知觉量表、心理弹性量表和症状自评量表,对722名地铁列车司机进行问卷调查,探究地铁司机的压力知觉的潜在类别及其影响因素。郑刚等[5]利用聚类分析法对不同司机进行分类,拟合不同类别司机的反应时间与驾驶速度之间的关系曲线。郭明[6]研究高速列车司机认知能力与驾驶安全的关系,利用机器学习方法建立评估和预测模型。国外研究则主要通过神经心理学测试[7]、模拟驾驶[8]、眼动追踪[9]等方法,对地铁司机的认知能力进行评估。
现有研究从多个角度评估了地铁司机的个体特征和认知能力,如通过眼动追踪、心电信号分析等方法预测司机的警觉度,或利用心理学测试探究司机的压力与知觉,但这些研究大多聚焦于特定的认知能力,而非司机所需认知能力的全貌。本研究探索一种新的基于VTS数据驱动的认知能力评估方法,通过XGBoost算法构建了地铁司机的评估模型,涵盖了广泛的认知能力维度,可更准确地评估司机在日常工作中面对故障判断、应急处理和规律理解等任务的认知表现。
1. 地铁司机认知能力的影响因素
在心理学领域,认知能力被广泛定义为个体处理、储存和检索信息的集成能力,涵盖感知、关注、评估与决策等多个关键维度,是个体理解问题、分析情况并做出反应的根基。地铁司机的工作环境要求在快速变化且不可预测的条件下,能够迅速且精确地处理大量信息并做出准确判断,这直接关系到运营的安全性,凸显了对司机认知能力研究的重要性。
地铁司机不仅要掌握驾驶技能和遵守信号规则,还必须具备敏锐的决策力和应急处理能力。在驾驶过程中,地铁司机需要实时解读信号,并根据实际情况调整列车行驶状态,同时应对如信号、车辆和站台门故障、乘客紧急情况的冲门夹门等多种复杂情景,这不仅考验司机的规则执行能力,更考验他们在面对未知和紧急情况时的快速思考与决策能力。反应速度在应急反应中至关重要,地铁司机能否迅速识别并有效应对如信号灯变化、障碍物侵入轨道等突发事件,直接关系到乘客与列车的安全。此外,地铁司机还需具备良好的手眼协调能力,以便在控制列车的同时,还能正确解读信号灯、精准控制车辆在站台的停靠等,这要求司机能够有效整合视觉、听觉和动作的信息输入。同时,持续的注意力集中和广阔的视野能帮助司机在长时间的工作中保持警觉性,也是保障地铁司机工作效率和安全的关键因素。
因此,从地铁司机的职业特性出发,深入研究其认知能力的构成和影响因素,通过采用维也纳测试系统(vienna test system,VTS)等专业评估工具[10],对司机的关键认知能力进行测评,有效识别司机的工作表现,可为提升地铁运营的安全性和效率提供科学评估和培训依据。
2. 基于Kmeans算法的地铁司机认知能力分类
2.1 VTS数据描述
本研究通过测量某地铁线路司机的VTS[10],共采集354组数据。为深入分析这些测评结果的内在关联性,利用皮尔逊相关系数计算6种评估模块的输出指标(共13个指标)间的相关性,以揭示其潜在联系,并有效识别及排除信息冗余。特征相关性热力图如图1所示。
图中,遗漏反应数与正确反应数的相关性系数为−0.62,即正确反应数越高,遗漏反应数越少。正确总数与错误总数的相关性系数为−0.4,可判断出特征具有冗余,故采用主成分分析对特征进行降维[11 − 12]。
2.2 聚类算法分类
为了对地铁司机的认知能力进行评估和创造出分类学习标签,方便后续使用有监督学习中的分类算法,本研究将对降维后的特征采用K-means聚类算法[13]。设定函数遍历13种降维维度,并在每次降维中以轮廓系数作为评价指标,对Kmeans聚类算法在8种聚类类别中利用肘部法则确定超参数K,最终遍历确定特征降维为1维,即主成分1。再用轮廓系数评价聚类效果,依赖簇内稠密和簇外离散判定。轮廓系数衡量:1) 样本与同簇相似度a;2) 样本与其他簇相似度b。单个样本的计算式为
s=b−amax(a,b) (1) 轮廓指标的取值介于−1和1之间。指标接近于1表示该数据点与同簇的其他数据点非常相似,与不同簇的数据点差异很大;反之,如果数据点与不同簇的数据点相似度较高,则该指标可能呈现负值。
图2为对比未降维和经过主成分分析降维后Kmeans聚类得出的轮廓系数。由图可见,降维前一些特征带有的信息和其他一些特征是重复冗余的(一些特征可能会线性相关造成多重共线性),因此确定出超参数K为2,即将降维后的VTS司机数据分为2簇,评价指标轮廓系数为0.589。
2.3 可视化分析聚类效果
考虑在无监督聚类分析中无条件标注评估模型,故通过探索性数据分析查看数据,研究集群关系和性质。根据测得的354个样本,本研究将Clusters为0定义为0类司机,同理Clusters为1定义为1类司机,得出0类司机占比83%,1类司机占比17%,故为不平衡分类问题。
为更直观地分析特征间的线性变化,以总体平均持续时间作为各特征回归子图的横轴,绘制特征间的回归分析图,如图3所示。
由图可知,相对于0类司机,1类司机的总体平均时间误差更大,且随着总体平均持续时间增加,总体平均时间误差降低;正确拒绝平均时间更长,且随着总体平均持续时间增加,正确拒绝平均时间减少。
通过可视化分析发现,1类司机在VTS测评中表现普遍较弱。鉴于1类司机在总体样本中占比较低,且将1类司机误判为0类司机可能导致重大损失,因此在构建后续分类模型时,特别需要注意处理数据不平衡问题。在模型评价指标选择时,要确保能够精准识别并正确分类这一重要的少数类司机群体。
3. 运用XGBoost对模型训练和优化
极端梯度提升(extreme gradient boosting, XGBoost)[14]能高效实现GBDT算法,并可进行算法和工程上的诸多改进。其基学习器兼具线性模型求解器和树模型学习算法,包含一个迭代残差树的集合,新生成的树拟合上次预测的残差,将每棵树预测的新样本输出值相加就得到样本最终的预测值。
设特征为m、样本容量为n的数据集
D={(xi,yi)}(|D|=n,xi∈Rm,yi∈R) ,假设集成树模型中总共有K 棵决策树,fk(xi) 为第k 棵树中第i 个样本被分类到所在叶子节点的权重,基于XGBoost算法得出预测值ˆyi 为ˆyi=Φ(xi)=K∑k=1fk(xi), fk∈F (2) XGBoost算法的学习目标是找出最优
ft ,最小化损失函数Obj为{Obj=n∑i=1l(yi,ˆy)+K∑k=1Ω(fk) Ω(fk)=γT+12λT∑j=1w2j (3) 式中:
n∑i=1l(yi,ˆy) 为损失函数;K∑k=1Ω(fk) 为正则化项;yi 为司机分类的真实值;ˆy 为模型预测输出;T 为集成树的叶子节点数;γ 为叶子树惩罚正则项,在预测过程中起到剪枝作用;λ 为权重惩罚正则项。本研究采用五折交叉验证训练模型。为避免将1类司机预测为0类司机带来巨大损失,需构建准确的模型评估指标,混淆矩阵形式[15]见表1。
表 1 混淆矩阵Table 1. Confusion matrix真实状态 预测状态 0类司机 1类司机 0类司机 TP FN 1类司机 FP TN 本研究采用召回率(Recall)[16]作为主要评价指标和调超参数方向,公式为
Recall=TPTP+FN (4) 此外,在评价指标中还采用F1-score指标作为调和平均数,其倾向于精确率和召回率两个数较小的数字,兼顾精确率和召回率,公式为
F1-score=21Precision+1Recall (5) 在XGBoost算法下设定超参数集:最大树木深度6,学习率0.06,树的数目96,样采样比例0.06,叶子节点分裂最小损失0.29。采用五折交叉验证得出单模型预测误差:准确率为0.97,召回率为0.95,F1-score为0.95。XGBoost算法的混淆矩阵结果显示,类别0正确预测60例,误判1例;类别1正确预测11例,误判1例。模型在召回率指标上的表现验证了其可高效地控制不漏报1类司机的预测,且其在调和平均数指标上表现最好。
4. 基于SHAP的特征指标重要度分析
最佳模型有助于对司机认知能力的精确分类,但其训练往往受限于黑箱模型的性质。SHAP (shapley additive explanations)值[17 − 18]基于博弈论的Shapley值,可用于解释模型中各特征的重要性,在SHAP分析框架中,每个预测样本对应一个预测值,SHAP值为预测样本中各特征所获得的数值,通过对所有可能的特征值组合进行加权求和,可得到模型的预测值为
ϕj=∑S⊆{x1,⋯,xp}∖{xj}|S|!(p−|S|−1)!p!⋅(fx(S∪{xj})−fx(S)) (6) 式中:
{x1,⋯,xp} 为所有特征的集合;{x1,⋯,xp}∖{xj} 为不包括{xj} 的所有特征可能的集合;S 为模型中特征X组合的子集(subset);p 为所有输入特征的数目;|S|!(p−|S|−1)!p! 为子集S的特征组合情况占比,即子集S的权重;fx(S∪{xj} 为模型包含特征j时训练的预测值。成千上万的数据单看特征对单一样本的影响是不够的,Summary Plot针对全部样本预测的解释对SHAP值按照特征维度聚合计算特征重要性,并以核密度(kernel density)估计展示定量数据的分布。SHAP汇总图如图4所示。
由图可知,平均反应时间(反应能力)越短,正确反应数(简单刺激做出正确反应能力)越高,正确总数(短时间内处理简单任务能力)越高,错误总数(对任务理解和注意力损伤程度)越低,视野越宽,模型越容易判别为0类司机。
SHAP依赖图结合了特征重要度和特征的影响,考虑了特征间的交互作用,如图5所示。
由图可知,在视野测评大约为180°的司机群体中,平均点击时间越短,说明反应速度越快,越有可能被模型分类为0类司机,说明视野范围和反应力之间紧密联系。因此,在探讨地铁司机的关键认知能力时,也须对反应时间、准确性与效率、持续注意力和广阔视野等因素进行深入分析,以确保乘客安全和列车高效运行。
通过分析可知,司机的平均反应时间是评估其应急处理能力的重要指标,直接影响其在紧急情况下能否迅速、正确地做出判断并采取措施,对实际运营下保障乘客安全和预防潜在事故至关重要。司机处理日常操作任务的准确性和效率可通过其正确反应的次数与总次数来衡量,这要求司机不仅持要续监控列车状态和信号系统,还需须具备卓越的任务处理能力,能够快速准确地完成包括调整列车速度和开闭车门在内的多项任务。长时间班次中,地铁司机的持续注意力对于精确捕捉和处理关键信息极其重要。在重复性任务中,司机是否能保持高警觉性和执行力,是衡量其有效管理注意力资源的一个关键,且在驾驶操作体力达到极限时尤为突出。通过测评司机的错误总数,可以直观地了解司机如何在长期工作负荷下通过保持集中注意力来避免错误,确保操作的准确性和列车的安全行驶。广阔的视野可以让司机能更好地监控列车和周围环境,预测并准备应对可能的情况,包括及时识别站台异常或轨道障碍物,正确解读信号灯和精准停靠车辆,从而有效完成日常任务。
5. 结 语
本研究建立的基于VTS数据驱动的地铁司机认知能力评估模型,在五折交叉验证中召回率和F1-score均达到0.95,显著提升了对表现不佳司机识别的准确性。采用SHAP模型分析得出,在分类模型评估中平均反应时间为最关键指标,其次为正确答案总数和视野范围。此外,反应迅速且能有效排除模拟任务中干扰的司机,拥有更强的选择性注意力,而具有宽广视野的司机通常能对视觉和听觉刺激做出更快速和准确的反应。综上所述,有效的注意力分配、敏捷的反应能力和良好的视野共同构成了地铁司机安全驾驶的关键要素。本研究结果在认知与应急能力领域为地铁司机的遴选、在岗测评和培训等工作提供更为精准的一个实用工具。
-
表 1 混淆矩阵
Table 1. Confusion matrix
真实状态 预测状态 0类司机 1类司机 0类司机 TP FN 1类司机 FP TN -
[1] 周晓勤. 中国城市轨道交通发展战略与“十四五”发展思路[J] . 城市轨道交通,2020(11):16 − 21. [2] 宋俊福. 铁路车站值班员应急处置能力评价体系构建[J] . 铁道运输与经济,2022,44(1):112 − 119, 133. [3] 潘雨帆, 史磊, 周宏宇等. 基于LSTM-Attention的高速铁路司机警觉度预测[J] . 铁道学报,2023,45(11):29 − 37. doi: 10.3969/j.issn.1001-8360.2023.11.004 [4] 何静, 丁晨辉, 刘伟. 地铁列车司机压力知觉的潜在剖面及影响因素[J] . 中国健康心理学杂志,2023,31(9):1359 − 1364. [5] 郑刚, 俎兆飞, 孔祚. 基于驾驶员反应时间的自动紧急制动避撞策略[J] . 重庆理工大学学报(自然科学),2020,34(12):45 − 52. [6] GUO M, HU L, YE L. Cognition and driving safety: How does the high-speed railway drivers’s cognitive ability affect safety performance[J] . Transportation Research Part F: Traffic Psychology and Behaviour,2019,65:10 − 22. doi: 10.1016/j.trf.2019.07.006 [7] ASCHENBRENNER A J, MURPHY S A, DOHERTY J M, et al. Neuropsychological correlates of changes in driving behavior among clinically healthy older adults[J] . The Journals of Gerontology: Series B,2022,77(10):1769 − 1778. doi: 10.1093/geronb/gbac101 [8] LI G, LAI W, SUI X, et al. Influence of traffic congestion on driver behavior in post-congestion driving[J] . Accident Analysis & Prevention,2020,141:105508. [9] LE A S, SUZUKI T, AOKI H. Evaluating driver cognitive distraction by eye tracking: From simulator to driving[J] . Transportation Research Interdisciplinary Perspectives,2020,4:100087. doi: 10.1016/j.trip.2019.100087 [10] 王清源, 黄远春, 刘志钢. 基于VTS测评的轨道交通驾驶员职业素质能力与大五人格特质的相关性分析[J] . 物流科技,2022,45(3):77 − 80 doi: 10.3969/j.issn.1002-3100.2022.03.019 [11] 刘海江, 吴雨林. 基于PCA-SVM的DCT汽车驾驶员起步意图识别[J] . 汽车工程学报,2021,11(5):369 − 378. doi: 10.3969/j.issn.2095-1469.2021.05.08 [12] HASAN B M S, ABDULAZEEZ A M. A review of principal component analysis algorithm for dimensionality reduction[J] . Journal of Soft Computing and Data Mining,2021,2(1):20 − 30. [13] 王丽芳, 刘泽, 何科毅, 等. 基于主成分分析和聚类分析的再造烟叶综合品质评价[J] . 品牌与标准化,2023(1):121 − 123. [14] CHEN T, GUESTRIN C. Xgboost: A scalable tree boosting system[C] //Proceedings of the 22nd ACM Sigkdd International Conference on Knowledge Discovery and Data Mining. New York: IEEE, 2016: 785−794. [15] XU J, ZHANG Y, MIAO D. Three-way confusion matrix for classification: A measure driven view[J] . Information Sciences,2020,507:772 − 794. doi: 10.1016/j.ins.2019.06.064 [16] YACOUBY R, AXMAN D. Probabilistic extension of precision, recall, and f1 score for more thorough evaluation of classification models[C] //Proceedings of the First Workshop on Evaluation and Comparison of NLP Systems. Stroudsburg: Association for Computational Linguistics, 2020: 79−91. [17] LUNDBERG S , LEE S I. A unified approach to interpreting model predictions[C] //Proceedings of the 31st Conference on Neural Information Processing Systems. Long Beach: NIPS, 2017. [18] 聂小虎, 吴东平, 安静仪, 等. 基于LightGBM和SHAP的地铁短时进站客流预测及影响因素分析[J] . 铁道经济研究,2023(5):50 − 55. doi: 10.3969/j.issn.1004-9746.2023.05.010 -