ML之FE:数据处理—特征工程之高维组合特征的处理案例(矩阵分解)——基于LoR算法的广告点击预估问题
目录
特征工程之高维组合特征的处理思路
1、原始数据:语⾔言和类型两种离散特征
2、为了提高拟合能力,语言和类型可以组成二阶特征
3、以逻辑回归算法为例例
4、所有的特征,才开始看起来没有任何问题
问题出现
问题解决
特征工程之高维组合特征的处理思路 1、原始数据:语⾔言和类型两种离散特征
3、以逻辑回归算法为例例
表示x_i和x_j的组合特征,w_ij的维度等于 |x_i|*|x_j| = 2*2 = 4
4、所有的特征,才开始看起来没有任何问题
但当引入ID类型的特征时,就会出现大规模数据。
(1)、⽤用户ID和物品ID对点击的影响
(2)、用户ID和物品ID的组合特征对点击的影响
问题出现
若用户的数量=m,物品的数量为n,那么学习的参数的规模mxn。但是可是,在互联⽹网环境下,数量 都可以达到千万量级,几乎无法学习这么大规模的参数。
问题解决有效的方法就是将用户和物品分别用k维的低维向量表示(k
关注
打赏
最近更新
- 深拷贝和浅拷贝的区别(重点)
- 【Vue】走进Vue框架世界
- 【云服务器】项目部署—搭建网站—vue电商后台管理系统
- 【React介绍】 一文带你深入React
- 【React】React组件实例的三大属性之state,props,refs(你学废了吗)
- 【脚手架VueCLI】从零开始,创建一个VUE项目
- 【React】深入理解React组件生命周期----图文详解(含代码)
- 【React】DOM的Diffing算法是什么?以及DOM中key的作用----经典面试题
- 【React】1_使用React脚手架创建项目步骤--------详解(含项目结构说明)
- 【React】2_如何使用react脚手架写一个简单的页面?