您当前的位置: 首页 >  矩阵
  • 0浏览

    0关注

    2393博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文

ML之FE:数据处理—特征工程之高维组合特征的处理案例(矩阵分解)——基于LoR算法的广告点击预估问题

一个处女座的程序猿 发布时间:2019-06-15 11:45:17 ,浏览量:0

ML之FE:数据处理—特征工程之高维组合特征的处理案例(矩阵分解)——基于LoR算法的广告点击预估问题

 

 

 

 

 

目录

特征工程之高维组合特征的处理思路

1、原始数据:语⾔言和类型两种离散特征

2、为了提高拟合能力,语言和类型可以组成二阶特征

3、以逻辑回归算法为例例

4、所有的特征,才开始看起来没有任何问题

问题出现

问题解决

 

 

 

 

特征工程之高维组合特征的处理思路 1、原始数据:语⾔言和类型两种离散特征

2、为了提高拟合能力,语言和类型可以组成二阶特征

 

3、以逻辑回归算法为例例

表示x_i和x_j的组合特征,w_ij的维度等于 |x_i|*|x_j| = 2*2 = 4

 

4、所有的特征,才开始看起来没有任何问题

但当引入ID类型的特征时,就会出现大规模数据。

(1)、⽤用户ID和物品ID对点击的影响

(2)、用户ID和物品ID的组合特征对点击的影响

 

问题出现

若用户的数量=m,物品的数量为n,那么学习的参数的规模mxn。但是可是,在互联⽹网环境下,数量 都可以达到千万量级,几乎无法学习这么大规模的参数。

问题解决

有效的方法就是将用户和物品分别用k维的低维向量表示(k

关注
打赏
1664196048
查看更多评论
立即登录/注册

微信扫码登录

0.0724s