当前位置:首页 >> 数学 >>

2014届高考数学一轮复习 第10章《总体分布及特征数的估计》名师首选学案 新人教A版


学案 55

总体分布及特征数的估计

导学目标: 1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率 折线图、茎叶图,理解它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据 标准差.3.能从样本数据中提取基本的数字特征(如平均数、 标准差), 并给出合理的解释.4. 会用样本的频率分布估计总体分布, 会用样本的基本数字特征估计总体的基本数字特征, 理 解用样本估计总体的思想.5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单 的实际问题. 自主梳理 1.在频率分布直方图中,纵轴表示____________________,数据落在各小组内的频率 用________________表示,所有长方形面积之和________. 2.作频率分布直方图的步骤 (1)求极差(即一组数据中最大值与最小值的差); (2)决定组距与组 数; (3)将数据分组; (4)列频率分布表; (5)画频率分布直方图. 3.频率分布折线图和总体密度曲线 (1)频率分布折线图:将频率分布直方图中各相邻的矩形的上底边的________顺次连结 起来,就得频率分布折线图,简称频率折线图. (2)总体密度曲线:如果将样本容量取得足够大,分组的组距取得足够小,那么相应的 频率折线图将趋于一条光滑曲线,我们称这条光滑曲线为总体分布的密度曲线. 4.当样本数据较少时,茎叶图表示数据的效果较好,一是统计图上没有原始数据丢失, 二是方便记录与表示,但当样本数据很多时,茎叶图的效果就不是很好了. 5.众数、中位数、平均数 (1)在一组数据中,出现次数________的数据叫做这组数据的众数. (2)将一组数据按大小依次排列, 把处在________位置的一个数据(或中间两个数据的平 均数)叫做这组数据的中位数. (3)如果有 n 个数 a1,a2,??,an,那么 a =____________________叫做这 n 个数的 平均数. 6.标准差和方差 (1)标准差是样本数 据到平均数的一种__________. (2)标准差: =______________________________________________________________ s ________________________________________________ ________________________. (3) 方 差 : s2 = _________________________________________________________________ ____________________________________________________________________ (xn 是样本数据,n 是样本容量, x 是样本平均数). 自我检测 1.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a,b)是其中的一组,抽查出的 个体在该组上的频率为 m,该组在频率分布直方图的高为 h,则|a-b|=________. 2.若某校高一年级 8 个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和 平均数分别是________和________.

8 9 7 9 3 1 6 4 0 2 3.在样本的频率分布直方图中,共有 11 个小长方形,若中间一个小长方形的面积等于
1

1 其他 10 个小长 方形的面积和的 ,且样本容量为 160,则中间一组的频数为________. 4 4.样本中共有五个个体,其值分别为 a,0,1,2,3.若该样本的平均值为 1,则样本方差 为______________. 5. 某棉纺厂为了解一批棉花的质量, 从中随机抽测了 100 根棉花纤维的长度(棉花纤维 的长度是棉花质量的重要指标), 所得数据均在区间[5,40]中, 其频率分布直方图如图所示, 则在抽测的 100 根中,有______根棉花纤维的长度小于 20 mm.

探究点一 频率分布直方图 例 1 如图是某市有关部门根据该市干部的月收入情况,作抽样调查后画出的样本频率 分布直方图,已知图中第一组的频数为 4 000,请根据该图提供的信息解答下列问题:(图 中每组包括左端点,不包括右端点,如第一组表示收入在[1 000,1 500)).

(1)求样本中月收入在[2 500,3 500)的人数; (2)为了分析干部的收入与年龄、职业等方面的关系,必须从样本的各组中按月收入再 用分层抽样方法抽出 100 人作进一步分析,则月收入在[1 500,2 000)的这段应 抽多少人? (3)试估计样本数据的中位数.

变式迁移 1 为了解某校高三学生的视力情况, 随机地抽查了该校 100 名高三学生的视 力情况,得到频率分布直方图如图,由于不慎将部分数据丢失,但知道前 4 组频数成等比数 列,后 6 组的频数成等差数列,设最大频率为 a,视力在 4.6 到 5.0 之间的学生数为 b,则 a,b 值分别为________和________.

2

探究点二 用样本数字特征估计总体数字特征 例 2 甲、乙、丙三名射箭运动员在某次测试中各射箭 20 次,三人的测试成绩如表所 示: 甲的成绩 环数 频数 乙的成绩 环数 频数

7 5

8 5

9 5

10 5

7 6

8 4

9 4

10 6

丙的成绩 环数 7 8 9 10 频数 4 6 6 4 s1、s2、s3 分别表示甲、乙、丙三名运动员这次测试成绩的标准差,则有 s1,s2,s3 的 大小关系为______________,三名运动员中________成绩最稳定. 变式迁移 2 甲、 乙两名射击运动员参加某大型运动会的预选赛, 他们分别射击了 5 次, 成绩如下表(单位:环): 甲 10 8 9 9 9 乙 10 10 7 9 9 如果甲、乙两人中只有 1 人入选,则入选的最佳人选应是________. 探究点三 用茎叶图分析数据 例 3 随机抽取某中学甲、乙两班各 10 名同学,测量他们的身高(单位:cm),获得身 高数据的茎叶图如图.

(1)根据茎叶图判断哪个班的平均身高较高; (2)计算甲班的样本方差; (3)现从乙班这 10 名同学中随机抽取两名身高不低于 173 cm 的同学,求身高为 176 cm 的同学被抽中的概率.

3

变式迁移 3 (2010·天津汉沽模拟)某班甲、乙两学生的高考备考成绩如下: 甲:512 554 528 549 536 556 534 541 522 538 乙:515 558 521 543 532 559 536 548 527 531 (1)用茎叶图表示两学生的成绩; (2)分别求两学生成绩的中位数和平均分.

1.几种表示频率分布的方法的优点与不足: (1)频率分布表在数量表示上比较确切,但不够直观、形象,分析数据分布的总体态势 不太方便. (2)频率分布直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们 能够看到在分布表中看不清楚的数据模式. 但从直方图本身得不出原始的数据内容, 也就是 说,把数据表示成直方图后,原有的具体数据信息就被抹掉了. (3)频率分布折线图的优点是它反映了数据的变化趋势, 如果样本容量不断增大, 分组的组距不断缩小, 那么折线图就趋向于总体分布的密度曲 线. (4)用茎叶图优点是原有信息不会抹掉,能够展示数据的分布情况,但当样本数据较多 或数据位数较多时,茎叶图就显得不太方便了. 2.标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的 离散程度越大, 标准差、 方差越小, 数据的离散程度越小, 因为方差与原始数据的单位不同, 且平方后可能夸大了偏差的程度, 所以虽然方差与标准差在刻画样本数据的分散程度上是一 样的,但在解决实际问题时,一般多采用标准差.

课后练习 (满分:90 分) 一、填空题(每小题 6 分,共 48 分) 1.如图,样本 A 和 B 分别取自两个不同的总体,它们的样本平均数分别为 x A 和 x B, 样本标准差分别为 sA 和 sB,则 x A________ x B,sA________sB(填大小关系).

2.10

名 工 人 某 天 生 产 同 一 种 零 件 , 生 产 的 件 数 分 别 是

4

15,17,14,10,15,17,17,16,14,12, 设其平均数为 a, 中位数为 b, 众数为 c, a=________, 则 b=________,c=________.

3. 为了了解某校高三学生的视力情况, 随机地抽查了该校 100 名高三学生的视力情况, 得到频率分布直方图如图,由于不慎将部分数据丢失,但知道后五组频数和为 62,设视力 在 4.6~4.8 之间的学生数为 a,最大频率为 0.32,则 a 的值为________. 4.下图是某学校举行的运动会上,七位评委为某体操项目打出的分数的茎叶统计图, 去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为________和________. 7?8?9| 9?4 4 6 4 7?3 5.有一个容量为 66 的样本,数据的分组及各组的频数如下: [11.5,15.5) 2 [15.5,19.5) 4 [19.5,23.5) 9 [23.5,27.5) 18 [27.5,31.5) 11 [31.5,35.5) 12 [35.5,39.5) 7 [39.5,43.5) 3 根据样本的频率分布估计,数据落在[31.5,43.5)的概率约是________. 6.甲、乙两人在 10 天中每天加工零件的个数用茎叶图表示如下图,中间一列的数字表 示零件个数的十位数,两边的数字表示零件个数的个位数,则这 10 天甲、乙两人日加工零 件的平均数分别为______和__________________________________________.

7 .将容量为 n 的样本中的数据分成 6 组,绘制频率分布直方图,若第一组至第六组数 据的频率之比为 2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于 27,则 n=________. 2 8.某老师从星期一到星期五收到的信件数分别为 10,6,8,5,6,则该组数据的方差 s =________. 二、解答题(共 42 分) 9.(14 分)甲、乙两人参加某体育项目训练,近期的五次测试成绩得分情况如图所示.

(1)分别求出两人得分的平均数与方差; (2)根据图和上面算得的结果,对两人的训练成绩作出评价.

5

10.(14 分)为了了解一个小水库中养殖的鱼的有关情况,从这个水库中多个不同位置 捕捞出 100 条鱼,称得每条鱼的质量(单位: kg),并将所得数据分组,画出频率分布直方 图(如图所示).

(1)在下面表格中填写相应的频率; 分组 [1.00,1.05) 频率

[1.05,1.10) [1.10,1.15) [1.15,1.20) [1.20,1.25) [1.25,1.30] (2)估计数据落在[1.15,1.30)中的概率为多少;
(3)将上面捕捞的 100 条鱼分别作一记号后再放回水库.几天后再从水库的多处不同位 置捕捞出 120 条鱼, 其中带有记号的鱼有 6 条. 请根据这一情况来估计该水库中鱼的总条数.

11.(14 分)某市 2010 年 4 月 1 日-4 月 30 日对空气污染指数的监测数据如下(主要污 染物为可吸入颗粒物): 61,76,70,56,81,91,92,91,75,81,88,67,101,103,95, 91,77,86,81,83,82,82,64,79,86,85,75,71,49,45. (1)完成频率分布表. (2)作出频率分布直方图. (3)根据国家标准,污染指数在 0~50 之间时,空气质量为优;在 51~100 之间时,为 良;在 101~150 之间时,为轻微污染;在 151~200 之间时,为轻度污染.
6

请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.

学案 55

总体分布及特征数的估计 答案

(3) (2)

自主梳理 1.频率与组距的比值 a1+a2+?+an

小长方形的面积

等于 1

3.(1)中点 平

5.(1)最多 均 距

(2)中间 离

n
1 [?

6.(1)
2

n

x1- x ?
2

2

+?

x2- x ?

+?+?

xn- x ?

2

1 2 2 ] (3) [(x1- x ) +(x2- x ) +?

n

+(xn- x ) ] 自我检测 1.

m h

频率 解析 在频率分布直方图中横轴是组距,高为 , 组距 所以|a-b|= . 2.91.5 91.5 解析 将这组数据从小到大排列,得 87,89,90,91,92,93,94,96. 87+89+90+91+92+93+94+96 故平均数 x = =91.5, 8 91+92 中位数为 =91.5. 2 3.32 1 1 x 解析 ∵中间一个占总面积的 ,即 = , 5 5 160 ∴x=32. 4.2 1 解析 由样本平均值为 1,知 (a+0+1+2+3)=1,故 a=-1. 5 1 1 2 2 2 2 2 2 ∴样本方差 s = [(-1-1) +(0-1) +(1-1) +(2-1) +(3-1) ]= (4+1+0+1 5 5 +4)=2. 5.30 解析 在频率分布直方图中小于 20 mm 的频率是 0.01×5+0.01×5+0.04×5=0.3, 故小于 20 mm 的棉花纤维的根数是 0.3×100=30(根). 课堂活动区

m h

7

例 1 解题导引 (1)解关于图形信息题的关键是正确理解各种统计图表中各个量的含 义,灵活运用这些信息和数据去发现结论. (2)在频率分布直方图中,最高矩形的中点对应值是众数;而中位数的左右两边的直方 图面积相等;平均数是直方图的“重心”. 解 (1)∵月收入在[1 000,1 500)的概率为 0.000 8×500=0.4,且有 4 000 人, 4 000 ∴样本的容量 n= =10 000; 0.4 月收入在[1 500,2 000)的频率为 0.000 4×500=0.2; 月收入在[2 000,2 500)的频率为 0.000 3×500=0.15; 月收入在[3 500,4 000)的频率为 0.000 1×500=0.05. ∴月收入在[2 500,3 500)的频率为 1-(0.4+0.2+0.15+0.05)=0.2. ∴样本中月收入在[2 500,3 500)的人数为 0.2×10 000=2 000. (2)∵月收入在[1 500,2 000)的人数为 0.2×10 000=2 000, ∴再从 10 000 人中用分层抽样方法抽出 100 人, 2 000 则月收入在[1 500,2 000)的这段应抽取 100× =20(人). 10 000 (3)由(1)知月收入在[1 000,2 000)的频率为 0.4+0.2=0.6>0.5, ∴样本数据的中位数为 0.5-0.4 1 500+ =1 500+250=1 750(元). 0.000 4 变式迁移 1 0.27 78 解析 由频率分布直方图知组距为 0.1. 4.3~4.4 间的频数为 100×0.1×0.1=1. 4.4~4.5 间的频数为 100×0.1×0.3=3. 又前 4 组的频数成等比数列,∴公比为 3. 3 从而 4.6~4.7 间的频数最大,且为 1×3 =27. ∴a=0.27. 根据后 6 组频数成等差数列,且共有 100-13=87(人). 6×5 设公差为 d,则 6×27+ d=87. 2 4×3 ∴d=-5,从而 b=4×27+ ×(-5)=78. 2 例 2 s2>s1>s3 丙 解析 由已知可得甲、乙、丙的平均成绩均为 8.5. 1 2 2 2 2 方法一 ∵s1= [(x1- x ) +(x2- x ) +?+(xn- x ) ],

n

∴ s1 = = 25 . 20

1 [5×? 7-8.5? 20

2

+5×? 8-8.5?

2

+5×? 9-8.5?

2

+5×? 10-8.5?

2

]

29 21 ,s3= ,∴s2>s1>s3. 20 20 丙成绩最稳定. 1 2 2 2 2 2 方法二 ∵s1= (x1+x2+?+xn)- x , 同理 s2=

n

1 5 2 2 2 2 2 2 ∴s1= (5×7 +5×8 +5×9 +5×10 )-8.5 =73.5-72.25=1.25= , 20 4
8

25 29 21 .同理 s2= ,s3= , 20 20 20 ∴s2>s1>s3.丙成绩最稳定. 变式迁移 2 甲 1 2 2 2 2 2 2 2 解析 x 甲= x 乙=9,s甲= [(9-10) +(9-8) +(9-9) +(9-9) +(9-9) ]= , 5 5 1 6 s2 = [(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]= >s2 ,故甲更稳定. 乙 甲 5 5 例 3 解题导引 茎叶图在样本数据较少,较为集中且位数不多时比较适用.由于它较 好地保留了原始数据,所以可以帮助我们分析样本数据的大致频率分布,还可以用来分析 样本数据的一些数字特征.但当样本数据较多时,茎叶图就显得不太方便了.因为数据较多 时,枝叶就会很长,需要占据较多的空间. 解 (1)由茎叶图可知:甲班身高集中于 160~179 之间,而乙班身高集中于 170~180 之间.因此乙班平均身高高于甲班. 158+162+163+168+168+170+171+179+179+182 (2) x = =170, 10 甲班的样本方差为 1 2 2 2 2 2 [(158-170) +(162-170) +(163-170) +(168-170) +(168-170) +(170- 10 2 2 2 2 2 170) +(171-170) +(179-170) +(179-170) +(182-170) ]=57.2. (3)设身高为 176 cm 的同学被抽中的事件为 A, 从乙班 10 名同学中抽中两名身高不低于 173 cm 的同学有:(181,173),(181,176), (181,178), (181,179), (179,173), (179,176), (179,178), (178,173), (178,176), (176,173) 4 2 共 10 个基本事件,而事件 A 含有 4 个基本事件,∴P(A)= = . 10 5 变式迁移 3 解 (1)两学生成绩的茎叶图如图所示. ∴s1=

(2)将甲、乙两学生的成绩从小到大排列为: 甲:512 522 528 534 536 538 541 549 554 556 乙:515 521 527 531 532 536 543 548 558 559 从以上排列可知甲学生成绩的中位数为 536+538 =537. 2 532+536 乙学生成绩的中位数为 =534. 2 甲学生成绩的平均分为 12+22+28+34+36+38+41+49+54+56 500+ =537, 10 乙学生成绩的平均分为 15+21+27+31+32+36+43+48+58+59 500+ =537. 10 课后练习区 1.< > 解析 A 中的数据都不大于 B 中的数据,所以 x A< x B,但 A 中的数据比 B 中的数据波 动幅度大,所以 sA>sB.

9

2.14.7 15 17 3.54 解析 前两组中的频数为 100×(0.05+0.11)=16. ∵后五组频数和为 62,∴前三组为 38. ∴第三组为 22.又最大频率为 0.32 的最大频数为 0.32×100=32,∴a=22+32=54. 4.85 1.6 解析 去掉最高分 93,最低分 79, 1 平均数为 (84+84+86+84+87)=85, 5 1 8 2 2 2 2 2 2 方差 s = [(84-85) +(84-85) +(86-85) +(84-85) +(87-85) ]= =1.6. 5 5 1 5. 3 22 解析 由条件可知,落在[31.5,43.5)的数据有 12+7+3=22(个),故所求概率约为 66 1 = . 3 6.24 23 解析

x 甲= (10×2+20×5+30×3+17+6+7)=24,
1 10

1 10

x 乙= (10×3+20×4+30×3+17+11+2)=23.
7.60 解析 ∵第一组至第六组数据的频率之比为 2∶3∶4∶6∶ 4∶1,∴前三组频数为 2+3+4 ·n=27,故 n=60. 20 8.3.2 10+6+8+5+6 解析 x = =7, 5 1 16 2 2 2 2 2 2 ∴s = [(10-7) +(6-7) +(8-7) +(5-7) +(6-7) ]= =3.2. 5 5 9.解 (1)甲、乙两人五次测试的成绩分别为: 甲 10 分 13 分 12 分 14 分 16 分 乙 13 分 14 分 12 分 12 分 14 分 甲、乙两人的平均成绩 x 甲= x 乙,都是 13 分,(6 分) 1 5 1 s2 = [(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.(12 分) 乙 5 2 2 (2)由 s甲>s乙,可知乙的成绩较稳定. 从折线图看,甲的成绩基本上呈上升状态,而乙的成绩在平均线上下波动,可知甲的成 绩在不断提高,而乙的成绩则无明显提高.(14 分) 10.解 (1)根据频率分布直方图可知,频率=组距×(频率/组距),故可得下表: 分组 频率 [1.00,1.05) 0.05

s2 = [(10- 13)2+(13 -13)2+(12-13)2+(14-13)2+(16-13)2 ]=4, 甲

[1.05,1.10) [1.10,1.15) [1.15,1.20)

0.20 0.28 0.30

10

[1.20,1.25) [1.25,1.30]
分) 120×100 (3)因为 =2 000, 6 所以水库中鱼的总条数约为 2 000.(14 分) 11.解 (1)频率分布表: 分组 频数 [41,51) [51,61) [61,71) [71,81) [81,91) [91,101) [101,111] (6 分) (2)频率分布直方图如图所示. 2 1 4 6 10 5 2

0.15 0.02

(6 分) (2)因为 0.30+0.15+0.02=0.47,所以数据落在[1.15,1.30)中的概率约为 0.47.(10

频率 2 30 1 30 4 30 6 30 10 30 5 30 2 30

(10 分) (3)答对下述两条中的一条即可: 1 ①该市有一个月中空气污染指数有 2 天处于优的水平,占当月天数的 ;有 26 天处于 15 13 14 良的水平,占当月天数的 ;处于优或良的天数为 28,占当月天数的 .说明该市空气质量 15 15 基本良好. 1 ②轻微污染有 2 天,占当月天数的 ;污染指数在 80 以上的接近轻微污染的天数 15, 15 17 加上处于轻微污染的天数 2,占当月天数的 ,超过 50%;说明该市空气质量有待进一步改 30 善.(14 分)

11


相关文章:
更多相关标签: