machine-learning
  • Welcome
  • 动手学深度学习
    • 1. 前言
    • 2. 预备知识
    • 3. 线性神经网络
    • 4. 多层感知机
    • 5. 深度学习计算
    • 6. 卷积神经网络
    • 7. 现代卷积神经网络
    • 8. 循环神经网络
    • 9. 现代循环神经网络
    • 10. 注意力机制
    • 11. 优化算法
    • 12. 计算性能
    • 13. 计算机视觉
    • 14. 自然语言处理:预训练
    • 15. 自然语言处理:应用
    • 16. 附录:深度学习工具
  • 百面机器学习
    • 1. 特征工程
    • 2. 模型评估
    • 3. 经典算法
    • 4. 降维
    • 5. 非监督学习
    • 6. 概率图模型
    • 7. 优化算法
    • 8. 采样
    • 9. 前向神经网络
    • 10. 循环神经网络
    • 11. 强化学习
    • 12. 集成学习
    • 13. 生成式对抗网络
    • 14. 人工智能的热门应用
  • 百面深度学习
    • 1. 卷积神经网络 CNN
    • 2. 循环神经网络 RNN
    • 3. 图神经网络 GNN
    • 4. 生成模型
    • 5. 生成式对抗网络 GAN
    • 6. 强化学习 RL
    • 7. 元学习
    • 8. 自动化机器学习 AutoML
    • 9. 计算机视觉 CV
    • 10. 自然语言处理 NLP
    • 11. 推荐系统
    • 12. 计算广告
    • 13. 视频处理
    • 14. 计算机听觉
    • 15. 自动驾驶
  • 统计学习方法
  • 推荐系统实践
    • 1. 推荐系统
    • 2. 特征工程
    • 3. Embedding
    • 4. 精排
    • 5. 召回
    • 6. 粗排/重排
    • 7. 多任务/多场景
    • 8. 冷启动
    • 9. 评估调试
    • 10. 自我修养
  • 深度学习推荐系统
    • 1. 推荐系统
    • 2. 进化之路
    • 3. 深度学习的应用
    • 4. Embedding
    • 5. 多角度审视
    • 6. 工程实现
    • 7. 评估方法
    • 8. 前沿实践
    • 9. 知识框架
  • 强化学习的数学原理
    • 1. 基础概念
    • 2. 贝尔曼公式
    • 3. 贝尔曼最优公式
    • 4. 值迭代与策略迭代
    • 5. 蒙特卡洛方法
    • 6. 随机近似与随机梯度下降
    • 7. 时序差分方法
    • 8. 值函数近似
    • 9. 策略梯度方法
    • 10. Actor-Critic方法
Powered by GitBook
On this page
  • 12.1 点击率评估 CTR
  • 1. 因子分解机模型(FM、FFM、Deep FM)**
  • 2. 深度兴趣网络 DIN ***
  • 3. 多臂老虎机 解决 冷启动 ***
  • 12.2 提高搜索广告召回 ****
  • 12.3 广告投放策略
  • 1. 实时竞价场景中,指定广告主的出价策略是什么问题?*
  • 2. 基于 RL 的竞价策略 ****
  • 3. 基于 深度RL 的竞价策略 ***
  1. 百面深度学习

12. 计算广告

12.1 点击率评估 CTR

1. 因子分解机模型(FM、FFM、Deep FM)**

  • 特征(大部分为类别)

    • 类别:用户特征、广告特征、上下文特征

    • 特点:高维稀疏,需要交叉特征

  • 因子分解机 FM(特征交叉)

    • y^FM(x)=μ+⟨w,x⟩+∑i=1n∑j=i+1n⟨vi,vj⟩xixj\hat y_{FM}(x)=\mu+\langle w,x\rangle+\sum_{i=1}^n \sum_{j=i+1}^n \langle v_i,v_j \rangle x_i x_jy^​FM​(x)=μ+⟨w,x⟩+∑i=1n​∑j=i+1n​⟨vi​,vj​⟩xi​xj​

    • 一阶 特征交叉项 + 二阶 特征交叉项

    • 每维特征学习一个 低维 embedding,减少模型参数

  • 域感知因子分解机 FFM(特征域)

    • y^FFM(x)=μ+⟨w,x⟩+∑i=1n∑j=i+1n⟨v(i,fj),v(j,fi)⟩xixj\hat y_{FFM}(x)=\mu+\langle w,x\rangle+\sum_{i=1}^n \sum_{j=i+1}^n \langle v_{(i,f_j)},v_{(j,f_i)} \rangle x_i x_jy^​FFM​(x)=μ+⟨w,x⟩+∑i=1n​∑j=i+1n​⟨v(i,fj​)​,v(j,fi​)​⟩xi​xj​

    • 参数量(输入维度 n,m 个特征域,嵌入维度 k):n+n(m−1)kn+n(m-1)kn+n(m−1)k

    • 降低参数量:域加权因子分解机(FwFM)

      • y^FwFM=μ+⟨w,x⟩+∑i=1n∑j=i+1n⟨vi,vj⟩xixjr(fi,fj)\hat y_{FwFM}=\mu+\langle w,x\rangle+\sum_{i=1}^n \sum_{j=i+1}^n \langle v_i,v_j \rangle x_i x_j r_{(f_i,f_j)}y^​FwFM​=μ+⟨w,x⟩+∑i=1n​∑j=i+1n​⟨vi​,vj​⟩xi​xj​r(fi​,fj​)​

      • 其中,r(fi,fj)r_{(f_i,f_j)}r(fi​,fj​)​ 是特征域之间的交叉权重系数,n+nk+m(m−1)2n+nk+\frac{m(m-1)}{2}n+nk+2m(m−1)​

  • 深度因子分解机 DeepFM(高阶特征交叉)

    • y^out=Sigmoid(y^FM+y^DNN)\hat y_{out}=Sigmoid(\hat y_{FM}+ \hat y_{DNN})y^​out​=Sigmoid(y^​FM​+y^​DNN​)

2. 深度兴趣网络 DIN ***

  • 用户兴趣多样性:大多模型,单峰兴趣特征

  • DIN:可以只关心与 该广告 相关的用户历史行为

3. 多臂老虎机 解决 冷启动 ***

  • 冷启动问题:新广告、长尾广告,没有准确的 CTR 预估

  • 多臂老虎机(RL 的简化版本)

    • 置信区间上界(UCB)算法:选择 UCB 最大的臂

    • Thompson 采样算法:每个臂的收益分布,建模为 Beta 分布

    • LinUCB:考虑上下文信息,维护 特征矩阵(臂的期望收益)

12.2 提高搜索广告召回 ****

  • 基于 点击数据 的 深度语义模型(DSSM)

    • 基本思想:将 query 和 documents(广告) 映射到同一个低维空间,然后计算 cos 相似性

    • 正样本:用户点击过的广告

    • 通过 语义相似性,召回部分广告,增加广告召回率(准确率)

12.3 广告投放策略

带约束的优化问题

1. 实时竞价场景中,指定广告主的出价策略是什么问题?*

  • 在预算约束下,最大化广告效果

2. 基于 RL 的竞价策略 ****

  • 请求特征 x,市场价格分布 m(δ;x)m(\delta;x)m(δ;x),其中 δ\deltaδ 是第二高竞价,预测点击率 θ(x)\theta(x)θ(x),剩余竞价机会 t,剩余预算 b

  • 价值函数 V(t,b)=V(t−1,b)+∑δ=0a(∫xtm(δ;xt)θ(xt)px(xt)dx+m(δ)(V(t−1,b−δ)−V(t−1,b)))V(t,b)=V(t-1,b)+\sum_{\delta=0}^a (\int_{x_t} m(\delta;x_t)\theta(x_t)p_x(x_t)dx+m(\delta)(V(t-1,b-\delta)-V(t-1,b)))V(t,b)=V(t−1,b)+∑δ=0a​(∫xt​​m(δ;xt​)θ(xt​)px​(xt​)dx+m(δ)(V(t−1,b−δ)−V(t−1,b)))

3. 基于 深度RL 的竞价策略 ***

  • 减少行动可选范围:出价策略设计为 a=λθ(x)a=\lambda \theta(x)a=λθ(x),行动只有 减小 / 增加 λ\lambdaλ

  • 收益函数反映总收益:分成若干回合(episode),有固定竞价次数和预算限制

Previous11. 推荐系统Next13. 视频处理

Last updated 3 years ago