R 软件一元线性回归分析 数据选自数理统计教材例题 8.4.1 合金钢强度与碳含量的数据 序号 碳含量/% 合金钢强度/107pa 1 0.10 42.0 2 0.11 43.0 3 0.12 45.0 4 0.13 45.0 5 0.14 45.0 6 0.15 47.5 7 0.16 49.0 8 0.17 53.0 9 0.18 50.0 10 0.20 55.0 11 0.21 55.0 12 0.23 60.0 这里取碳含量为 x 是普通变量,取合金钢强度为 y 是随机变量 使用 R 软件对以上数据绘出散点图 程序如下: > x=matrix(c(0.1,42,0.11,43,0.12,45,0.13,45,0.14,45,0.15,47.5,0.16,49,0.17,53,0.18,50,0.2,55,0.21,55,0.23,60),nrow=12,ncol=2,byrow=T,dimnames=list(1:12,c("C","E"))) >outputcost=as.data.frame(x) >plot(outputcost$C,outputcost$E) 0.100.120.140.160.180.200.2245505560ou tpu tcost$Coutputcost$E很显然这些点基本上(但并不精确地)落在一条直线上。 下面在之前数据录入的基础上做回归分析(程序接前文,下同) > lm.sol = lm(E~C,data = outputcost) >summary(lm.sol) 得到以下结果: Call: lm(formula = E ~ C, data = outputcost) Residuals: Min 1Q Median 3Q Max -2.00449 -0.63600 -0.02401 0.71297 2.32451 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 28.083 1.567 17.92 6.27e-09 *** C 132.899 9.606 13.84 7.59e-08 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 1.309 on 10 degrees of freedom Multiple R-squared: 0.9503, Adjusted R-squared: 0.9454 F-statistic: 191.4 on 1 and 10 DF, p-value: 7.585e-08 由计算结果分析: 常数项0 =28.083,变量(即碳含量)的系数1 =132.899 得到回归方程:y =28.083+132.899x 由于回归模型建立使用的是最小二乘法 ,而最小二乘法只是一种单纯的数学方法 ,存在着一定的缺陷 ,即不论变量间有无相关关系或有无显著线性相关关系 ,用最小二乘法都可以找到一条直线去拟合变量间关系。所以回归模型建立之后 ,还要对其进行显著性检验 : 在上面的结果中 sd(0 )=1.567,sd(1 )=9.606。而对应于两个系数的P值 6.27e-09 和 7.59e-08,故是非常显著的。 关于方程的检验,残差的标准差 =1.309。相关系数的平方R...