数据挖掘综合应用:泰坦尼克号幸存顾客预测案例
分类问题: 依据现有的数据来对顾客进行预测,判断其是可以幸存还是不能幸存。
# 导入库
import pandas as pd
import numpy as np
# 读取原始数据
df = pd.read_csv('./titanic_trains.csv')
# 读取数据前五行
df.head()
#通过观察数发现需要特征编码、特征选择、离散化、缺失值处理。不需要特征缩放、不
数据挖掘综合应用:泰坦尼克号幸存顾客预测案例
分类问题: 依据现有的数据来对顾客进行预测,判断其是可以幸存还是不能幸存。
# 导入库
import pandas as pd
import numpy as np
# 读取原始数据
df = pd.read_csv('./titanic_trains.csv')
# 读取数据前五行
df.head()
#通过观察数发现需要特征编码、特征选择、离散化、缺失值处理。不需要特征缩放、不
微信扫码登录