Last updated 3 years ago
感知模块:传感器,物体检测、场景分割
决策模块:模糊理论、RL
控制模块:执行指令
优点:无需引入大量人工规则、架构简单高效、自主学习没有指定的规则
PilotNet
离线训练:输入图像,输出方向盘角度
测评指标:自动化程度=1−人工干预次数×6s行驶时长(s)自动化程度=1-\frac{人工干预次数\times 6 s}{行驶时长(s)}自动化程度=1−行驶时长(s)人工干预次数×6s
基于 RL 的 多智能体 决策系统(Mobileye)
多智能体 交互能力:Markov 条件的不必要性,决策过程使用 DAG
未知突发状况 处理能力
根据危险事件概率,调整奖励值 r≪−1pr \ll -\frac1pr≪−p1,波动性较大
可学习策略 + 不可学习策略(人工强制约束)