5. 召回

5.1 传统召回模型

  • 基于物料属性的倒排索引:相同属性的物料集合,集合内部按照后验 CTR 降序排序

  • 协同统计的协同过滤算法:UserCF, ItemCF*

    • 相比于 user,item 的数量更少且稳定,提前计算 ATAA^TA

    • 计算 ATAA^TA 有成熟的 map-reduce 算法,计算方便

    • 由于 item 相对较少,可以 broadcast ATAA^TA,分布式预测

  • 矩阵分解(Matrxi Factorization, MF)

    • 只能用 user_id, item_id 作为特征,信息有限

    • 无法冷启动

  • 合并多路召回:各路的 topN

5.2 向量化召回

Embedding-Based Retrieval, EBR

Last updated