Youtube 召回算法#

Youtube 在 《Deep Neural Networks for YouTube Recommendations》一文中介绍的基于 DNN 的召回算法,非常经典,开 DNN 在召回中应用的先河。
youtube

Near#

u2i 召回的典型思路:user 与其观看过的视频,在向量空间中是相近的

Far#

论文只提到了随机负采样

Embedding#

user embedding:

  • 用户看过视频的 embedding,pooling 成一个向量

  • 用户搜索的关键词的 embedding,pooling 成一个向量

  • 以上两个向量,加上一些用户基本属性,拼接成一个大向量,经过多层全连接层(FC)进行交叉,最后一层 FC 的输出就是 user embedding

item embedding:

  • 模型最后会转变成多分类问题,item embedding 就是最后一层相应位置的模型参数,即最后一步计算的是 user embedding 和 item embedding 的点积

  • 论文中输入时的视频 embedding,是预先训练好的,和此处的 item embedding 并不一致

Loss#

使用 sampled softmax loss