电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

多元统计分析VIP免费

多元统计分析_第1页
多元统计分析_第2页
多元统计分析_第3页
作业一1.2分析2016年经济发展情况排名省gdp占比累计占比1广东79512.0510.3010.302江苏76086.29.8620.173山东67008.28.6828.854浙江464856.0234.875河南40160.015.2040.086四川32680.54.2444.317湖北32297.94.1948.508河北31827.94.1252.629湖南31244.74.0556.6710福建28519.23.7060.3711上海27466.23.5663.9312北京24899.33.2367.1613安徽24117.93.1370.2814辽宁22037.882.8673.1415陕西19165.392.4875.6216内蒙古18632.62.4178.0417江西18364.42.3880.4218广西18245.072.3682.7819天津17885.42.3285.1020重庆17558.82.2887.3721黑龙江15386.091.9989.3722吉林14886.231.9391.3023云南14869.951.9393.2224山西12928.31.6894.9025贵州11734.431.5296.4226新疆95501.2497.6627甘肃7152.040.9398.5928海南4044.510.5299.1129宁夏3150.060.4199.5230青海2572.490.3399.8531西藏1150.070.15100.00将2016各省的GDP进行排名,可以发现,经济发达的的地区主要集中在东部地区。西部gdp的占比较小。作出2016各省的gdp直方图如下:作业二多元回归分析2.1多元线性回归2.1.1数据来源《福建省统计年鉴-2017》年份商品零售价格指数y农业生产资料价格指数x1工业生产价格指数x2工业生产者购进价格指数x3固定资产投资价格总指数x4200098.997.4100.5112.4100.220019898.798.196.799.5200298.399.997.697.699.7200399.1101.8100.7106.3101.42004102.7112.5102.6113.3103.42005100.6108.1100.2108.1100.72006100.5100.999.2103.91022007104.3110.3100.8104.3105.92008105.7123.6102.7110.2105.9200997.993.395.593.2982010103.4102.4103.2107.7103.32011104.8111.8103.9108106.22012101.8103.398.797.7100.32013101.199.598.498.4100.12014101.199.598.698.3100.4201599.9101.49796.198.32016100.7100.299.1981002.1.2模型假设商品的零售价格会受很多因素的影响,对于影响零售价格指数y的影响现在仅考虑农业生产资料指数x1、工业生产价格指数x2、工业生产者购进价格指数x3、固定资产投资的影响x4。2.1.3模型建立为了大致分析y与x1、x2、x3、x4,建立y关于x1、x2、x3、x4的散点图,可以看出y与X呈现出较为明显的线性相关关系。由此可以建立y关于x的多元线性回归模型:y=a0+a1x1+a2x2+a3x3+a4x4运用MatlabR2017a画y关于x的散点图如下:2.1.4模型求解和分析运用MatlabR2017a进行多元回归分析,使用命令为:[b,bint,r,rint,stats]=regress(y,X,alpha)在这里y是n*1的列向量,x是n*(m+1)的矩阵且第一列向量全是1,alpha采用默认值0.05。将Excel的数据导入Matlab运行结果截图如下:由计算结果可得:参数参数估计值置信区间a011.84[-23.7566,47.4395]a10.1304[-0.0041,0.2648]a20.5429[-0.1834,1.2961]a3-0.1796[-0.3628,0.0036]a40.3945[-0.1545,0.9432]R2=0.8699统计量观测值F=20.0540检验值p=0.0000误差方差估计=0.9995可知y=11.84+0.1304x1+0.5429x2−0.1796x3+0.3945x4以上结果的置信度为95%,R2=0.8699,F=20.0540,p=0.0000<0.05,可知回归模型成立。分析其杠杆残差图如下:执行rcoplot(r,rint)由残差图可以看出,除第二个数据外,其它数据的残差离零点都较近,且残差的置信区间均包含零点,这说明回归模型y=11.84+0.1304x1+0.5429x2−0.1796x3+0.3945x4能较好的符合原始数据,而第二个数据为异常点。由模型可以看出对商量零售价格影响最大的是工业生产价格指数,工业生产价格指数每上升一个点,商品零售价格指数约上升0.5。2.1.5逐步回归分析运用Matlab采用逐步回归的方法对数据进行建模分析,命令为stepwise(x,y,inmodel,alpha)这里inmodel采取所有变量,alpha采用默认值,输如命令得到下图:可以看出,四条线均为实线,无需对变量进行剔除,选中四条线,可以得到下图:由图可知,模型结果同2.1.4中的模型,即:y=11.84+0.1304x1+0.5429x2−0.1796x3+0.3945x42.2非线性回归2.2.1数据来源《福建省统计年鉴-2017》年份工业总产值(亿元)能源生产量(万吨标准煤)年份工业总产值(亿元)能源生产量(万吨标准煤)198187.7649319993479.841634.16198295.7752220003994.861654.171983103.9760920014398.0...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

文章天下+ 关注
实名认证
内容提供者

各种文档应有尽有

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部