5TableofContents绪言有监督学习广义线性模型线性与二次判别分析核岭回归支持向量机随机梯度下降1Thisbookistranslatedfromofficialuserguideofscikit-learn
绪言2有监督学习31
广义线性模型英文原文以下介绍的方法均是用于求解回归问题,其目标值预计是输入变量的一个线性组合
写成数学语言为:假设 是预测值,则有在本节中,称向量为 coef_,{%math%}w0{%endmath%}为`intercept`若要将通用的线性模型用于分类问题,可参见Logistic回归1
1普通最小二乘法LinearRegression使用系数拟合一个线性模型
拟合的目标是要将线性逼近预测值()和数据集中观察到的值( )两者之差的平方和尽量降到最小
写成数学公式,即是要解决以下形式的问题广义线性模型4LinearRegression的 fit方法接受数组X和y作为输入,将线性模型的系数存在成员变量 coef_中:>>>fromsklearnimportlinear_model>>>clf=linear_model
LinearRegression()>>>clf
fit([[0,0],[1,1],[2,2]],[0,1,2])LinearRegression(copy_X=True,fit_intercept=True,n_jobs=1,normalize=False)>>>clf
coef_array([0
5])需要注意的是,普通最小二乘法的系数预测取决于模型中各个项的独立性
假设各个项相关,矩阵的列总体呈现出线性相关,那么就会很接近奇异矩阵,其结果就是经