日期:2026-04-13 点击数:393
近日,清华大学智能产业研究院(AIR)团队在《npj Artificial Intelligence》上发表研究,首次系统揭示了人类与自动驾驶算法在视觉注意力上的本质差异。研究采用3×3×2混合实验设计,招募36名驾驶员(18名专家、18名新手),并借助七鑫易维aSee Pro眼动仪完成了关键的眼动数据采集。
据了解,在异常检测任务中,5名驾驶员以250Hz采样率全程记录,为后续注意力阶段划分、注视轨迹建模及人机对比提供了高精度、高稳定性的数据基础。

基于这些数据,团队提出人类驾驶注意力并非单一连续过程,而是分为扫描、检查、重新评估三个阶段。其中“检查阶段”的语义注意力——即理解“看到了什么意义”——是提升算法性能的关键入口。
数据显示,专家在检查阶段的平均时长为705.75ms,显著高于新手的622.52ms。进一步将不同阶段的人类注意力融入AxANet、UniAD等模型后发现,检查阶段注意力的融入效果最为稳定显著:AxANet在异常检测中的准确率从0.724提升至0.736,UniAD在轨迹规划中的平均L2误差从0.90m降至0.82m。
这表明,算法真正缺失的不是模仿“看哪里”,而是补入“为什么看”的语义信息。该研究不仅将眼动追踪从实验室观测工具推进为模型优化的语义信号,也印证了七鑫易维aSee Pro这类科研级设备已能深度参与国际前沿研究的完整闭环——从数据采集、认知阶段划分到算法验证,为自动驾驶、人机交互等领域提供了可复制的方法路径。
关注公众号回复“进群”即可加入群聊

主办单位:深圳市增强现实技术应用协会
地址:深圳市宝安区兴东社区南天辉创研中心6楼
电话:18938893801 Email:Vip@szar.org.cn
《中华人民共和国电信与信息服务业务经营许可证》编号: 粤ICP备18013217号
关注微信公众号
手机查看
