数据挖掘综合应用:贷款产品预测案例
本案例采用pandas加载数据,分析属性之间的相关性,探索数据内部的关系,采用分类模型算法中的决策树、随机森林与梯度提升树进行分类预测,基于网格搜索的方式进行最优参数搜索,获取申请贷款的预测结果
数据源文件格式:
tract_to_msamd_income,rate_spread,population,minority_population,number_of_owner_occupied_units,number_of_1_to_4_family_units,loan_amount_000s,hud_median_family_income,applicant_income_000s,state_name,state_abbr,sequence_number,respondent_id,purchaser_ty