machine-learning
  • Welcome
  • 动手学深度学习
    • 1. 前言
    • 2. 预备知识
    • 3. 线性神经网络
    • 4. 多层感知机
    • 5. 深度学习计算
    • 6. 卷积神经网络
    • 7. 现代卷积神经网络
    • 8. 循环神经网络
    • 9. 现代循环神经网络
    • 10. 注意力机制
    • 11. 优化算法
    • 12. 计算性能
    • 13. 计算机视觉
    • 14. 自然语言处理:预训练
    • 15. 自然语言处理:应用
    • 16. 附录:深度学习工具
  • 百面机器学习
    • 1. 特征工程
    • 2. 模型评估
    • 3. 经典算法
    • 4. 降维
    • 5. 非监督学习
    • 6. 概率图模型
    • 7. 优化算法
    • 8. 采样
    • 9. 前向神经网络
    • 10. 循环神经网络
    • 11. 强化学习
    • 12. 集成学习
    • 13. 生成式对抗网络
    • 14. 人工智能的热门应用
  • 百面深度学习
    • 1. 卷积神经网络 CNN
    • 2. 循环神经网络 RNN
    • 3. 图神经网络 GNN
    • 4. 生成模型
    • 5. 生成式对抗网络 GAN
    • 6. 强化学习 RL
    • 7. 元学习
    • 8. 自动化机器学习 AutoML
    • 9. 计算机视觉 CV
    • 10. 自然语言处理 NLP
    • 11. 推荐系统
    • 12. 计算广告
    • 13. 视频处理
    • 14. 计算机听觉
    • 15. 自动驾驶
  • 统计学习方法
  • 推荐系统实践
    • 1. 推荐系统
    • 2. 特征工程
    • 3. Embedding
    • 4. 精排
    • 5. 召回
    • 6. 粗排/重排
    • 7. 多任务/多场景
    • 8. 冷启动
    • 9. 评估调试
    • 10. 自我修养
  • 深度学习推荐系统
    • 1. 推荐系统
    • 2. 进化之路
    • 3. 深度学习的应用
    • 4. Embedding
    • 5. 多角度审视
    • 6. 工程实现
    • 7. 评估方法
    • 8. 前沿实践
    • 9. 知识框架
  • 强化学习的数学原理
    • 1. 基础概念
    • 2. 贝尔曼公式
    • 3. 贝尔曼最优公式
    • 4. 值迭代与策略迭代
    • 5. 蒙特卡洛方法
    • 6. 随机近似与随机梯度下降
    • 7. 时序差分方法
    • 8. 值函数近似
    • 9. 策略梯度方法
    • 10. Actor-Critic方法
Powered by GitBook
On this page
  • 15.1 自动驾驶的基本概念 *
  • 15.2 端到端的自动驾驶模型 **
  • 15.3 自动驾驶的决策系统 ***
  1. 百面深度学习

15. 自动驾驶

Previous14. 计算机听觉Next统计学习方法

Last updated 3 years ago

15.1 自动驾驶的基本概念 *

  • 感知模块:传感器,物体检测、场景分割

  • 决策模块:模糊理论、RL

  • 控制模块:执行指令

15.2 端到端的自动驾驶模型 **

  • 优点:无需引入大量人工规则、架构简单高效、自主学习没有指定的规则

  • PilotNet

    • 离线训练:输入图像,输出方向盘角度

    • 测评指标:自动化程度=1−人工干预次数×6s行驶时长(s)自动化程度=1-\frac{人工干预次数\times 6 s}{行驶时长(s)}自动化程度=1−行驶时长(s)人工干预次数×6s​

15.3 自动驾驶的决策系统 ***

  • 基于 RL 的 多智能体 决策系统(Mobileye)

    • 多智能体 交互能力:Markov 条件的不必要性,决策过程使用 DAG

    • 未知突发状况 处理能力

      • 根据危险事件概率,调整奖励值 r≪−1pr \ll -\frac1pr≪−p1​,波动性较大

      • 可学习策略 + 不可学习策略(人工强制约束)