本案例可用于帮助大家对前面知识的掌握,同样也可以用于毕业设计等用途,我写文的初衷只是帮助大家对知识的掌握。
文章目录
一、背景和目的
-
- 一、背景和目的
- 二、探索性数据集分析 (EDA)
- 三、可视化
- 三、模型创建
-
- 3.1 逻辑回归模型
- 3.2 SMOTE - 合成少数过采样技术
- 3.3 交叉验证的决策树
- 3.4 交叉验证
- 3.5 XGBoost
- 四、总结
该数据集包含使用信用卡进行的金融交易的数据。这些数据是指欧洲运营商的客户,指的是 2013/9年期间。
该研究的目的是创建一个预测模型,该模型能够从通过数据集获得的“学习”中识别欺诈交易。信用卡公司能够提前识别欺诈行为至关重要。
数据集内容 交易发生在两天内,总共 284,807 笔交易中有 492 笔是欺诈。数值变量是通过 PCA 变换(降维)获得的。
特征 V1、V2、… V28 是使用 PCA 获得的主成分,唯一没有使用 PCA 转换的特征是“时间”和“金额”。特征“时