machine-learning

⌘Ctrlk

5. 召回

5.1 传统召回模型

基于物料属性的倒排索引：相同属性的物料集合，集合内部按照后验 CTR 降序排序
协同统计的协同过滤算法：UserCF, ItemCF*
- 相比于 user，item 的数量更少且稳定，提前计算 $A^TA$
- 计算 $A^TA$ 有成熟的 map-reduce 算法，计算方便
- 由于 item 相对较少，可以 broadcast $A^TA$ ，分布式预测
矩阵分解（Matrxi Factorization, MF）
- 只能用 user_id, item_id 作为特征，信息有限
- 无法冷启动
合并多路召回：各路的 topN

5.2 向量化召回

Embedding-Based Retrieval, EBR

Previous4. 精排 Next6. 粗排/重排

Last updated 1 year ago