二手数据的特点:搜集比较容易,采集数据成本低,能很快得到
局限性不是为特定讨论问题产生有欠缺,需要评估
、二手数据的评估:谁收集,目的,怎么搜集,什么时侯收集
概率抽样与非概率抽样比较:性质不同,非概不依据随机原则选样本,样本统计量分布不确切,无法使用样本的结果对总体相应参数进行推断
操作简便,时效快,成本低,专业要求不很高
概率抽样依据随机原则抽选样本,理论分布存在,对总体有关参数可进行估量,计算估量误差,得到总体参数的置信区间
提出精度要求
数据收集方法的选择:抽样框中有关信息,目标总体特征,调查问题的内容,有形辅助物的使用,实施调查的资源,管理与控制,质量要求实验中的若干问题:人的意愿,心理问题,道德问题回答误差:理解误差,记忆误差,有意识误差误差的控制:抽样误差是抽样随机性带来的,不可避开可以计算,改大样本量
选择合适改进的抽样框,设计好的调查问卷,调查过程的质量控制
抽样误差因素:样本量大小,总体变异性大大 抽样方式选 组织形式数据审核的目的:检查数据是否有错误,原始数据完整性准确性,二手适用性时效性
数据筛选的目的:根据需要找出符合特定条件的某类数据
数据排序是按一定的顺序将数据排列,以便讨论者通过浏览数据发现一些明显的特征或趋势,找到解决问题的线索
数据透视表作用:可以对数据表重要信息按使用者的习惯或分析要求进行汇总和作图,形成一个符合需要的交叉表数据分布表的制作步骤:确定组数,确定组距,根据分组整理成频数分布表,上组限不在内不重不漏直方图与条形图的差别:首先条形图是用条形的长度表示各类别频数的多少,宽度是固定的;直方图用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,高宽均有意义
其次由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列
最后条形图主要用于展示分类数据,直方图主要用于展示数值型数据