市场研究的数据分析方法通过本章学习,掌握市场营销研究的基本数据分析方法。掌握线性回归分析方法及其应用;掌握判别分析法及其应用;了解聚类分析及其具体方法和步骤;了解因子分析方法的数学模型和相关统计量以及基本步骤;了解对应分析方法及其基本步骤;、了解多维偏好分析法的主成分分析模型;了解多维尺度法及其分析步骤;了解联合分析方法的基本模型及其基本步骤。第一节线性回归分析一、线性回归方程的基本模型线性回归分析是考察变量之间的数量关系变化规律,它通过一定的数学表达式—回归方程,来描述这种关系,以确定一个或几个变量的变化对另一个变量的影响程度,为预测提供数学依据。线性回归方程从样本资料出发,一般利用最小二乘法,根据回归只限于向本资料点在垂直方向上的偏离程度最低的原则,进行回归方程的参数的求解。根据线性回归方程总之变量的个数,回归方程可分为一元线性回归方程和多元线性回归方程。(一)一元线性回归模型一元线性回归模型是两个变量之间的关系可以通过有关的参数直接用直线关系来表示。(二)多元回归模型多元线性回归模型中自变量的个数在2个以上。二、线性回归方程的统计检验1、回归方程拟合优度检验2、回归方程的显着性检验3、回归系数显着性检验三、回归分析假设条件的检验1、残差分析2、多重共线性3、误差项的序列相关四、线性回归分析的基本步骤1、确定回归中的自变量和因变量。2、从收集到样本资料出发确定自变量和因变量之间的数学关系,即建立回归方程。3、对回归方程进行各种统计检验。4、利用回归方程进行预测。在利用统计软件进行回归分析时,只有第一步由用户给定,其它均可由计算机完成。第二节判别分析一、判别分析法的基本思想判别分析是一种进行统计鉴别和分组的技术,最早由费雪(Fisher)于1936年提出。它是根据观察或测量到若干变量值,判断研究对象如何分类的方法。在进行判别分析时,首先必须已知观察对象的分类和若干表明观察对象特征的变量值。然后再从中筛选出能提供较多信息的变量并建立判别函数,然后利用其结果对待判对象进行判断其类别。在判别分析中,称分类变量为因变量,而用以分类的其它特征变量称为判别变量或自变量。简而言之,判别分析包括以下两步:1、分析和解释各类指标之间存在的差异,并建立判别函数。2、以第一步的分析结果为依据,将对那些未知分类属性的案例进行判别分类。二、判别分析基本模型与统计术语(一)假设条件1、每一个类别都取自一个多元正态总体的样本2、所有正态总体的协方差矩阵或相关矩阵都相等(二)基本模型判别分析的基本模型是判别函数,它表示为分组变量与满足假设条件的判别变量之间的线性关系。(三)统计术语1、先验概率2、后验概率3、判别系数4、结构系数5、分组的矩心6、判别力指数7、残余判别力三、分析的基本步骤1、确定研究的问题2、获取判别分析的数据3、进行判别分析4、评价和解释分析结果第三节聚类分析一、聚类分析的基本思想聚类分析(又称数字分类学)是新近发展起来的一种研究分类问题的多元统计分析方法。它是根据事物本身的特性研究个体分类的方法,其基本原则是同类的个体有较大的相似性,而不同类的个体的差异很大。在聚类分析中,根据分类对象的不同可分为样品聚类(Q型聚类)和变量聚类(R型聚类)两种。样品聚类是对事件进行聚类,或是说对观测量进行聚类,使对反映被观测对象的特征的变量值进行分类。变量聚类则是当反映事物特点的变量很多是,我们根据所研究的问题选择部分变量对事物的某一方面进行研究的聚类方法。二、距离与相似系数(一)定距或定比率数据的距离和相似系数1.常用的距离指标有:欧式距离、欧式距离的平方、曼哈顿距离、切比雪夫距离幂距离2.常用的相似系数指标主要有:余弦系数、皮尔逊相关系数(二)定类数据的距离1.卡方距离2.法方距离三、聚类方法(一)层次聚类法(二)迭代聚类法四、聚类分析的主要步骤1.确定研究的问题2.计算相似性3.聚类4.聚类结果的解释和证实第四节因子分析一、因子分析的基本思想因子分析是一项多元统计分析技术,其主要目的就是简化数据。它通过研究众多变量之间的内部依赖关系,探求观测数...