阿里妹导读:基于时间碎片化、视频交互强、内容丰富、体验好等因素,短视频近几年处在流量风暴的中心,各大平台纷纷涉足短视频领域。因此,平台对短视频内容的推荐尤为重要,千人千面是短视频推荐核心竞争力。短视频一般从“点击率”与“观看时长”两方面优化来提升用户消费时长。
接下来,UC事业部国际研发团队的童鞋,将从这两方面重点论述短视频模型点击时长多目标优化。
作者:邢日良、马泽峰、彭卫华
背景目前,信息流短视频排序是基于CTR预估Wide&Deep深层模型。在Wide&Deep模型基础上做一系列相关优化,包括相关性与体感信号引入、多场景样本融合、多模态学习、树模型等,均取得不错收益。
总体上,短视频模型优化可分为两部分优化:
- 感知相关性优化——点击模型以优化(CTR/Click为目标)
- 真实相关性优化——时长多目标优化(停留时长RDTM/播放完成率PCR)
上述收益均基于点击模型的优化,模型能够很好地捕抓USER-ITEM之间感知相关性,感知权重占比较高,弱化真实相关性,这样可能导致用户兴趣收窄,长尾问题加剧。此外,观看时长,无论是信息流、竞品均作为重要优化目标。在此背景下,短视频排序模型迫切需要引入时长多目标优化,提升推荐的真实相关性,寻求在时长上取得突破。
时长多目标的引入,排序模型不仅仅优化点击目标,同时也要兼顾时长目标,使得排序模型的感知相关性与真实相关性之间取得收益最大化的平衡;目前业界点击+时长目标优化有多种方式,包括多模态学习(点击+时长)、联合建模、样本reweight等。
本次我们使用样本reweight方法,在点击label不变的前提下,时长作为较强的bias去影响时长目标,保证感知相关性前提,去优化真实相关性。此外,我们正调研更加自适应的时长建模方式(point-wise、list-wise),后续继续介绍。上述是模型时长多目标优化简介,样本reweight取得不错的收益,下面展开介绍下。
RDTM REWEIGHTING观看时长加权优化,我们使用weightlogistic regression方法,参照RecSys2016上Youtubb时长建模,提出点击模型上样本reweight。模型训练时,通过观看时长对正样本加权,负样本权重不变,去影响正负样本的权重分布,使得观看时长越长的样本,在时长目标下得到充分训练。
加权逻辑回归方法在稀疏点击场景下可以很好使得时长逼近与期望值。假设
就是weighted logistic regression学到的期望,其中N是样本数量,K是正样本,Ti是停留时长,真实期望就近似逼近E(T)*(1+P),P是点击概率,E(T)是停留时长期望值,在P 多模态联合学习的方向。此外,沉淀了套策略review和数据分析方法论,为后续时长优化提供数据基础。
虽然现阶段短视频时长多目标优化取得不错收益,但是规则性较多,后续我们将逐步转向自适应的时长建模,从point-wise到全局list-wise时长优化,由感知相关性优化转向真实相关性优化,力争在消费时长取得重大突破。自适应点击目标与时长目标的权衡收益最大化,将是我们面临一大挑战。
写在最后
国际信息流短视频算法团队是阿里巴巴UC事业部国际研发部下的信息流算法团队,依托阿里庞大的国际产品矩阵与海量的数据,致力于打造业内一流的信息流推荐算法,服务于数亿用户的国际市场。最后,我们也欢迎各位牛人加入我们团队,
欢迎访问: UC事业群 ,看看是否有你心仪的岗位!