对于已经调好参数的模型,我们需要将其保存下来,可以使用下面两种方法。
模型训练from sklearn.tree import DecisionTreeClassifier
from sklearn import datasets
X, y = datasets.load_iris(return_X_y=True)
model = DecisionTreeClassifier()
model.fit(X, y)
sklearn.externals.joblib
import joblib
# 模型保存
joblib.dump(model, 'DecisionTree.pkl')
# 模型加载
model = joblib.load('DecisionTree.pkl')
pickle
import pickle
# 模型保存
f = open('DecisionTree.pickle', 'wb')
pickle.dump(model, f)
f.close()
# 模型加载
f = open('DecisionTree.pickle', 'rb')
model = pickle.load(f)
f.close()
joblib与pickle对比
对于大数据而言,joblib
比pickle
更加高效,但是joblib
只能将对象存储在磁盘文件中,不能保存为字符串。