近日,信息检索和数据挖掘领域的顶级会议CIKM 2022公布了论文奖项,快手社区科学团队凭借其在应用研究方向的突出贡献荣获“最佳论文奖”。
该获奖论文题为《实时短视频推荐在移动设备上的实现》,针对短视频推荐场景中存在的问题,提出了全新的解决方案。传统的推荐系统大多部署在服务端,无法即时响应用户反馈,导致推荐结果不够精准。而论文提出的方法则通过在移动客户端部署推荐系统,能够实时收集用户反馈,从而提升推荐结果的精准度,改善用户体验。
该方案已在快手短视频推荐系统中全面部署,每日影响超过3.4亿用户,成为端上智能在大规模推荐场景中成功落地的典范。
近年来,用户通过短视频应用进行学习和娱乐的需求日益增长。他们通过点赞、收藏和分享等互动方式,表达对视频内容的满意度。为了更好地推荐用户感兴趣的内容,推荐系统必须能够及时感知用户的实时兴趣。然而,由于短视频内容丰富多样,用户兴趣变化迅速,这给推荐系统带来了巨大挑战。
传统推荐系统完全部署在服务端,虽然具备一定的推荐能力,但在决策时机和实时特征利用方面存在明显不足。具体表现为: 1. 决策时机:服务端只有在接收到客户端请求时才有机会调整推荐内容,无法即时响应用户的实时反馈。 2. 特征时效性:用户的反馈需回传至服务端才能被利用,整个过程耗时较长,影响推荐效果。
随着移动设备性能的提升,现在可以在移动设备上部署推荐系统,以解决上述问题。该系统通过端上重排模型,实时收集用户反馈,结合客户端特有的特征,如网速、视频预加载时长等,提高了推荐结果的准确性。此外,通过自适应搜索步数的beam search算法,生成整体效果更好的排序结果,进一步提升了用户体验。
系统主要分为三大部分: 1. 服务端推荐系统:包含召回、排序和重排等环节,输出候选视频。 2. 模型训练系统:负责训练模型并将其部署到客户端。 3. 客户端推荐系统:负责收集用户反馈并触发重排过程。
在现有技术中,端上重排模型通常采用端云结合的结构。而本研究设计了一个超轻量级的小模型,可以整体部署在客户端。这种设计的优势在于: 1. 减少了重复计算和资源开销。 2. 客户端能获取的实时特征较为简单,不需要复杂的网络结构。 3. 精排模型捕捉了用户的长期兴趣,与客户端侧重实时兴趣的模型形成互补。
模型的输入特征分为三类: 1. 精排模型预估分:包含了丰富的特征信息,是重要的输入特征。 2. 视频静态属性:如类别、时长等,整体特征数量控制在合理范围内。 3. 客户端特征:如用户反馈、网速、视频预加载时长等,这些特征直接影响用户体验。
通过增加交叉特征,如候选视频与观看历史视频的差值,视频曝光时间差和位置差等,增强了实时特征的效果。
模型整体结构通过target attention机制建模已观看视频序列与候选视频的关系。上层通过MMoE模块建模多个目标,如下滑、有效播放和点赞等。基于beam search的生成式重排方法,逐步生成推荐结果,进一步提升了推荐效果。
实验表明,端上重排模型相比传统的单点排序方法,各个指标均有显著提升。尤其是在线上环境中,基于自适应搜索步数的beam search方法,进一步提升了推荐效果,且对用户体验无负面影响。
端上重排系统大大提升了推荐系统的实时性,改善了用户体验。未来将继续探索端上推荐系统的实时特征利用,推动端上智能在工业界和学术界的进一步发展。