多元回归就像线性回归一样,但是具有多个独立值,这意味着我们试图基于两个或多个变量来预测一个值。
文章目录
一、数据集
- 一、数据集
- 二、案例实现
请看下面的数据集,其中包含了一些有关汽车的信息。 我们可以根据发动机排量的大小预测汽车的二氧化碳排放量,但是通过多元回归,我们可以引入更多变量,例如汽车的重量,以使预测更加准确。
第一步:读取数据
import pandas
from sklearn import linear_model
df = pandas.read_csv("cars.csv")
df
如下: 第二步:提取自变量与因变量。
X = df[['Weight', 'Volume']] # 自变量两个
y = df['CO2']
第三步:建立模型并预测
regr = linear_model.LinearRegression() #建立模型
regr.fit(X, y) # 训练
第四步: 预测。 预测重量为 2300kg、排量为 1300ccm 的汽车的二氧化碳排放量:
pre = regr.predict([[2300, 1300]])
print(pre)
结果为:
[107.2087328]
第五步:获取回归的系数。
print(regr.coef_)
如下:
[0.00755095 0.00780526]
结果数组表示重量和排量的系数值:
Weight: 0.00755095
Volume: 0.00780526
这些值告诉我们,如果重量增加 1g,则 CO2 排放量将增加 0.00755095g。
如果发动机尺寸(容积)增加 1 ccm,则 CO2 排放量将增加 0.00780526g。