为了了解7月25日至8月24日北京地区的气温分布状况,我们对以往年份这段时间的日最高气温进行抽样,并对得到的数据进行分析.我们随机抽取近年来北京地区7月25日至8月24日的日最高气温,得到如下样本(单位:℃):请看课本P50表2-2-1,试分析两个时段高温(≥330c)的状况.上面两样本中的高温天数的频率用下表表示:时间总天数高温天数(频数)频率7月25日~8月10日17110.6478月8日~8月24日1720.118由此表可以发现,近年来,北京地区7月25日至8月10日的高温天气的频率明显高于8月8日至8月24日.当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布.我们把反映总体频率分布的表格称为频率分布表.例1从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高样本,数据如下(单位:cm).试作出该样本的频率分布表.请同学们在P51表2-2-3中观察,最小值是什么?最大值是什么?最大值与最小值的差是多少?最小值为151,最大值为180,差为29.我们取区间[150.5,180.5]可以完全覆盖这些数据.如果把将此区间分成10个小区间,则每个小区间的长度为3.我们把整个取值区间长度称为全距,分成的区间的长度称为组距.(1)什么是频数?什么是频率?(2)什么是全距?全距与组数、组距之间的关系是什么?回答下列问题解(1)在全部数据中找出最大值180和最小值151,则两者之差为29,确定全距为30,决定以组距3将区间[150.5,180.5]分成10个组;(2)从第一组[150.5,153.5)开始,分别统计各组中的频数,再计算各组的频率,频率/组距,将结果填入表中,从而即得频率分布表.分组频数频率频率/组距[150.5,153.5)40.040.013[153.5,156.5)80.080.026[156.5,159.5)80.080.026[159.5,162.5)110.110.036[162.5,165.5)220.220.073[165.5,168.5)190.190.063[168.5,171.5)140.140.046[171.5,174.5)70.070.023[174.5,177.5)40.040.013[177.5,180.5]30.030.01合计1001该校学生身高样本频率分布表为:这张表给出了该身高样本处于各个区间内的人数和频率,由此可估计该校高一学生的身高的分布状况.一般地,编制频率分布表的步骤如下:(1)求全距,决定组数和组距,组距=全距/组数;(2)分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;(3)登记频数,计算频率,频率/组距.列出频率分布表.如果取全距时不利于分组如果取全距时不利于分组((如不能被组数整除如不能被组数整除),),可可适当增加全距适当增加全距,,如再左右两端各增加适当范围如再左右两端各增加适当范围((尽尽量使两端增加的量相同量使两端增加的量相同).).思考?在编制频率分布表时,分的组数过多或过少各有何利弊?练习分组频数频率[1.45,1.75)40.20[1.75,2.05)50.25[2.05,2.35)30.15[2.35,2.65)50.25[2.65,2.95)10.05[2.95,3.25]20.1合计2011.下面是不同厂家生产的手提式电脑的重量(单位:kg),试选取适当的组距,列出其频率分布表:1.92.02.12.42.42.83.22.31.52.62.61.92.42.21.61.71.71.81.83.0D2.一个容量为20的数据样本,分组与频数为:[10,20]2个、(20,30]3个、(30,40]4个、(40,50]5个、(50,60]4个、(60,70]2个,则样本数据在区间(-∞,50]上的可能性为()A.5%B.25%C.50%D.70%3.在一本书中,分组统计100句中的字数,得出下列结果:字数1~5个15句字数6~10个的27句,字数11~15个的32句,字数16~20个数的15句,字数21~25个的8句,字数26~30个的3句,请作出字数的频率分布表,并利用组中值对该书中平均每个句子的字数作出估计.分组频数频率[1,5]150.15[6,10]270.27[11,15]320.32[16,20]150.15[21,25]80.08[26,30]30.03合计1001因为3×0.15+8×0.27+13×0.32+19×0.15+23×0.08+29×0.03=12.15≈12,估计该书中平均每个句子包含的字数约为12个.注:组中值为各个组区间的中点的数值作业:P591、2、