机器学习深度学习高阶内容系列-kaggle广告点击欺诈识别实战
中国是全球最大的智能移动设备市场,每月有超过10亿台智能移动设备投入使用 。TalkingData是中国最大的独立大数据服务平台,覆盖全国70%以上的活跃移动设备。每天处理30亿次点击,其中90%是潜在的欺诈。目前防止应用程序开发人员点击欺诈的方法是测量用户在其产品组合中的点击历程,并标记产生大量点击但最终不会安装应用程序的IP地址。根据这些信息,建立了一个IP黑名单和设备黑名单。Kaggle提供了一个覆盖了4天内约2亿次点击的数据集,本案例的挑战是建立一个算法,预测用户点击移动应用广告后是否会下载应用。
https://www.kaggle.com/c/talkingdata-adtracking-fraud-detection/overview
目录
- kaggle广告点击欺诈识别实战
- libraries and Util Functions
- Input Files
-
- 数据源
- 特征选择
- Feature Engineering
- Prepare Data Set
-