15. 自动驾驶

15.1 自动驾驶的基本概念 *

基于 RL 的 多智能体 决策系统（Mobileye）
- 多智能体交互能力：Markov 条件的不必要性，决策过程使用 DAG
- 未知突发状况处理能力
  - 根据危险事件概率，调整奖励值 $r \ll -\frac1p$ ，波动性较大
  - 可学习策略 + 不可学习策略（人工强制约束）

Last updated 3 years ago

15.2 端到端的自动驾驶模型 **

优点：无需引入大量人工规则、架构简单高效、自主学习没有指定的规则

PilotNet

15.3 自动驾驶的决策系统 ***

基于 RL 的 多智能体 决策系统（Mobileye）