河南大学数学与信息科学学院2012~2013学年第二学期统计软件与模型实验论文题目中国各地区按行业分就业人数统计与区域经济的发展姓名陈俊颖学号1022300250年级2010级专业计算机科学与技术成绩合分人中国各地区按行业分就业人数统计与区域经济的发展摘要:本文简单地对2011年全国各地区按行业分私营企业及个体的就业人数进行统计和研究,利用基础的统计学知识和统计学软件进行分析,从而发现不同行业在不同地区就业人数的一些特征,并得出当年全国各地区民营企业的就业情况及就业人数的分布对当地经济发展情况是否有影响
为推测我国市场经济的发展趋势及合理分配人力资源等问题提供可靠的信息和依据
关键词:城市私营企业和个体就业人数相关性聚类分析一、引言近几年来,中国的经济发展迅猛,一方面当然是我国的社会主义市场经济体制优越性的体现,另一方面则是第三产业和民营企业对国民经济发展的带动作用
众所周知,一国市场经济的健康发展与就业问题是密不可分的,因此本人利用对我国各地区不同行业的就业人数的情况进行统计和分析,发现其中的一些关联,从而可以看出我国的人力资源在各地区不同行业下的分布情况,进而分析我国的经济发展现状和预测未来的发展趋势
二、模型概述本人将运用多元统计学中的一种比较基础也是比较常用的方法——聚类分析法,来进行分析和研究
聚类分析又称群分析,它是研究(样品或指标)分类问题的一种多元统计方法
聚类分析包含系统聚类法、样品聚类法、动态聚类法、模糊聚类法、图论聚类法、聚类预报法等
为了将样品(或指标)进行分类,就需要研究样品之间的关系
主要采用两种方法:相似系数法,即性质越接近的样品,它们的相似系数的绝对值越接近1,而彼此无关的样品,它们的相似系数的绝对值越接近于0
比较相似的样品归为一类,其他的归为一类
距离法,即将一个样品看做P维空间的一个点,并在空间定义距离,距离较近的点归为一类,距离较远的