河南大学数学与信息科学学院2012~2013学年第二学期统计软件与模型实验论文题目中国各地区按行业分就业人数统计与区域经济的发展姓名陈俊颖学号1022300250年级2010级专业计算机科学与技术成绩合分人中国各地区按行业分就业人数统计与区域经济的发展摘要:本文简单地对2011年全国各地区按行业分私营企业及个体的就业人数进行统计和研究,利用基础的统计学知识和统计学软件进行分析,从而发现不同行业在不同地区就业人数的一些特征,并得出当年全国各地区民营企业的就业情况及就业人数的分布对当地经济发展情况是否有影响。为推测我国市场经济的发展趋势及合理分配人力资源等问题提供可靠的信息和依据。关键词:城市私营企业和个体就业人数相关性聚类分析一、引言近几年来,中国的经济发展迅猛,一方面当然是我国的社会主义市场经济体制优越性的体现,另一方面则是第三产业和民营企业对国民经济发展的带动作用。众所周知,一国市场经济的健康发展与就业问题是密不可分的,因此本人利用对我国各地区不同行业的就业人数的情况进行统计和分析,发现其中的一些关联,从而可以看出我国的人力资源在各地区不同行业下的分布情况,进而分析我国的经济发展现状和预测未来的发展趋势。二、模型概述本人将运用多元统计学中的一种比较基础也是比较常用的方法——聚类分析法,来进行分析和研究。聚类分析又称群分析,它是研究(样品或指标)分类问题的一种多元统计方法。聚类分析包含系统聚类法、样品聚类法、动态聚类法、模糊聚类法、图论聚类法、聚类预报法等。为了将样品(或指标)进行分类,就需要研究样品之间的关系。主要采用两种方法:相似系数法,即性质越接近的样品,它们的相似系数的绝对值越接近1,而彼此无关的样品,它们的相似系数的绝对值越接近于0。比较相似的样品归为一类,其他的归为一类。距离法,即将一个样品看做P维空间的一个点,并在空间定义距离,距离较近的点归为一类,距离较远的点归为不同类。三、实证分析*以下采用的统计数据资料全部来源于《2012年中国统计年鉴》4-6各地区按行业分私营企业和个体就业人数(2011年底)单位:万人地区合计#制造业#建筑业#交通运输、#批发和#住宿和#租赁和商#居民服务仓储和邮政业零售业餐饮业务服务业和其他服务业全国总计18298.94317.2772.7512.07425.31072.4970.11083.2北京558.845.624.315.5154.729.173.921.0天津145.341.66.25.647.35.312.85.3河北626.2159.317.219.2276.532.713.436.3山西317.945.17.85.9163.624.18.428.3内蒙古301.532.28.613.3136.834.312.225.4辽宁767.0155.040.268.7287.740.033.441.7吉林363.751.130.314.6134.727.810.034.2黑龙江442.657.214.319.0199.342.019.537.8上海660.7132.347.322.8239.918.884.117.1江苏2125.1879.8171.139.5639.164.677.681.7浙江1479.5691.656.426.2436.448.666.356.9安徽598.5119.621.310.4275.133.026.249.2福建583.3129.516.79.3259.131.438.236.1江西631.5140.311.820.1260.839.117.769.6山东1280.7337.555.443.5547.164.859.570.9河南802.8166.820.715.6387.257.828.054.3湖北779.1130.625.526.9359.163.028.159.9湖南685.886.716.713.9323.031.990.035.1广东1670.8437.239.930.1698.488.3106.685.1广西433.966.78.119.1224.425.618.520.6海南103.96.38.24.538.48.28.68.1重庆443.863.017.110.3185.128.639.624.2四川795.0127.022.421.6377.668.729.654.7贵州215.927.76.25.8101.317.87.014.2云南514.168.935.910.6215.643.220.529.7西藏46.02.75.40.919.46.51.93.9陕西388.345.113.96.9186.940.519.438.7甘肃205.923.510.03.1103.622.95.615.1青海64.511.25.51.424.57.40.94.1宁夏95.19.83.91.850.37.74.38.8新疆171.526.54.45.772.718.78.315.2以上是关于截止到2011年底全国各地区按行业分私营企业和个体的就业人数(单位:万人)的统计数据,由于数据是来自中国统计年鉴的官方数据,个人认为该数据的说服力和权威性是比较强的。但由于数据较多,在这里根据研究需求,本人仅选取了共8列31行数据进行分析,其中包括城市、制造业、建筑业、交通运输仓储和邮政业、批发和零售业...