当前位置:首页 >> 数学 >>

2.2.1 用样本的频率分布估计总体的分布


2.2.1 用样本的频率分

布估计总体分布

1、用样本去估计总体是研究统计 问题的一基本思想 2、前面我们学过的抽样方法有: 简单随机抽样、系统抽样、分层抽样。 要注意这几种抽样方法的联系与区别。 3、 初中时我们学习过样本的频率分布, 包括频数、 频率的概念,频数分布表和 频数分布直方图的制作。

1、抛掷硬币

的大量重复试验的结果: 频率分布表: 样本容量为72 088
实验结果 正面向上 反面向上 频数 36 124 35 964 频率 0.501 1 0.498 9

频率分布条形图
0.7 0.6

0.5 0.4
0.3 0.2 0.1

结论:当试验次数 频率 “正面向上”记为 无限增大时,两种试验 0 “反面向上”记为1 结果的频率大致相等。 注意: ① 各长方形长条的宽度要相同。 ②相邻长条的间距要适当。 试验结果 ③长方形长条的高度 表示取各值的频率。 0 1

如何用样本的频率分布 估计总体分布?

我国是世界上严重缺水的国家之一, 城市缺水问题较为突出。

2000年全国主要城市中缺水情况排在前10位的城市

例1:某市政府为了节约生活用水,计划在本市 试行居民生活用水定额管理,即确定一个居民月用 水量标准a , 用水量不超过a的部分按平价收费,超 过a的部分按议价收费。

①如果希望大部分居民的日常生活不受影响,那 么标准a定为多少比较合理呢?
②为了较合理地确定这个标准,你认为需要做 哪些工作?

通过抽样,我们获得了100位居民某年的月平均 用 水量(单位: t) ,如下表:

思考:由上表,大家可以得到什么信息?

频率分布直方图 步骤: 4.3 - 0.2 = 4.1 极差 4.1 组数= 2.决定组距与组数: = = 8.2 组距 0.5 1.求极差:
3.将数据分组(组距0.5,组数9)

[0,0.5 ),[0.5,1 ),…,[4,4.5]

4.列频率分布表
100位居民月平均用水量的频率分布表

5.画频率分布直方图
频率/组距 0.50 0.40 0.30 0.20 0.10 0

注意: ① 这里的纵坐标不是频率, 而是频率/组距;
直方图

② 某个区间上的频率用这个 区间的面积表示;
0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量/t

频率 小长方形的面积 = 组距× = 频率 组距 思考:所有小长方形的面积之和等于?

频率 组距
0.5 0.4 0.3 0.2 0.1
O

宽度:组距
高度:
频率 组距

0.5 1 1.5 2 2.5 3 3.5 4 4.5

月均用水量/t

上图称为频率分布直方图,其中横轴 表示月均用水量,纵轴表示频率/组距. 频率分布直方图中各小长方形的宽度 和高度在数量上有何特点?

图形的意义:频率分布直方图中各小长 方形的面积表示什么?各小长方形的面 积之和为多少? 频率 宽度:组距 组距
0.5 0.4 0.3 0.2 0.1
O

高度:
0.5 1 1.5 2 2.5 3 3.5 4 4.5

频率 组距

月均用水量/t

各小长方形的面积=频率 各小长方形的面积之和=1

分析例题:频率分布直方图非常直观地 表明了样本数据的分布情况,使我们能 够看到频率分布表中看不太清楚的数据 模式,但原始数据不能在图中表示出来. 你能根据上述频率分布直方图指出居民 月均用水量的一些数据特点吗? 频率
组距 0.5 0.4 0.3 0.2 0.1
O

0.5 1 1.5 2 2.5 3 3.5 4 4.5

月均用水量/t

频率 组距
0.5 0.4 0.3 0.2 0.1
O

0.5 1 1.5 2 2.5 3 3.5 4 4.5

月均用水量/t

(1)居民月均用水量的分布是“山峰”状的,而 且是“单峰”的;
(2)大部分居民的月均用水量集中在一个中间值 附近,只有少数居民的月均用水量很多或很少; (3)居民月均用水量的分布有一定的对称性等.

画一组数据的频率分布直方图,可以按以下的 步骤进行:
一、求极差,即数据中最大值与最小值的差 二、决定组距与组数 :组距=极差/组数 三、分组,通常对组内数值所在区间, 取左闭右开区间 , 最后一组取闭区间 四、登记频数,计算频率,列出频率分布表 五、画出频率分布直方图(纵轴表示频率/组距)

练习
1.有一个容量为50的样本数据的分组的频数如下: [12.5, 15.5) 3
[15.5, 18.5) [18.5, 21.5) 8 9 [24.5, 27.5) [27.5, 30.5) [30.5, 33.5) 10 5 4

[21.5, 24.5) 11 (1)列出样本的频率分布表; (2)画出频率分布直方图; (3)根据频率分布直方图估计,数据落在[15.5, 24.5)的 百分比是多少?

解:组距为3
分组 频数
3

频率

频率/ 组距

[12.5, 15.5)

[15.5, 18.5) 8 [18.5, 21.5) 9 [21.5, 24.5) 11 [24.5, 27.5) 10 [27.5, 30.5) [30.5, 33.5) 5 4

0.06 0.16 0.18 0.22 0.20 0.10 0.08

0.020 0.053 0.060 0.073 0.067 0.033 0.027

频率分布直方图如下:
频率

组距
0.070 0.060 0.050 0.040 0.030 0.020

0.010 12.5 15.5

2. 为检测某种产品的质量,抽取了一个容量为30的样本, 检测结果为一级品5件,二级品8件,三级品13件,次品4件. (1) 列出样本的频率分布表; (2) 画出表示样本频率分布的条形图; (3)根据上述结果,估计此种产品为二级品或三级品的概率 约是多少. 产品 频数 频率 解: 0.7 频率 一级品 5 0.17 解: 0.6 产品 频数8 频率 解: (1)样本的频率分布表为: 0.27 二级品 0.5 一级品 0.43 三级品 5 13 0.17 0.4 (1)样本的频率分布表为: 二级品 (2)样本频率分布 0.3 0.13 次品 8 4 0.27 0.43 三级品 13 的条形图为: 0.2 0.1 4 0.13 次品 产品
一级品 二级品 三级品 次品

(3)此种产品为二级品或三级品的概率约为 0.27+0.43=0.7.

3.一个容量为100的样本,数据的分组和各组的相 关信息如下表,试完成表中每一行的两个空格.
分组 [12,15) [15,18) [18,21) [21,24) [24,27) [27,30) [30,33) [33,36]
合计

频数 6

频率
0.08

频率累计

0.30
21 0.69

16
0.10 1.00 100 1.00

课堂小结:
频率分布直方图
应用

1.求极差 2.决定组距与组数

步骤

3.将数据分组
4.列频率分布表 5.画频率分布直方图

探究:
同样一组数据,如果组距不同,横轴、纵轴的单位 不同,得到的图的形状也会不同。不同的形状给人以不 同的印象,这种印象有时会影响我们对总体的判断。分 别以1和0.1为组距重新作图,然后谈谈你对图的印象。

知识回顾
频率分布直方图
应用

1.求极差 2.决定组距与组数

步骤

3.将数据分组
4.列频率分布表 5.画频率分布直方图

频率分布折线图
频率/组距 0.50 0.40 0.30 0.20 0.10 0

0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量/t

连接频率直方图中各小长方形上端中点的折线,叫 频率分布折线图

当样本容量无限增大,分组的组距无限缩小,那 么频率分布折线图就会无限接近一条光滑曲线 ——总体密度曲线.
频率 组距

总体在区间(a , b)内取值的频率

S
a b

产品 尺寸 (mm)

总体密度曲线
总体密度曲线反映了总体在各个范围内取值的
百分比,精确地反映了总体的分布规律。是研究总

体分布的工具.
用样本分布直方图去估计相应的总体分布时, 一般样本容量越大,频率分布直方图就会无限接 近总体密度曲线,就越精确地反映了总体的分布

规律,即越精确地反映了总体在各个范围内取值
百分比。

应用举例:
例1、对某电子元件进行寿命追踪调查,情况如下:
寿命 个数
100~200 200~300 300~400 400~500 500~600

20

30

80

40

30

(1)列出频率分布表; (2)画出频率分布直方图; (3)估计电子元件寿命在100h~400h以内的频率; (4)估计电子元件寿命在400h以上的频率;

(1)列出频率分布表;
寿命 100~200 200~300 300~400 400~500 500~600 合计 频数 20 30 80 40 频率 0.10 0.15 0.40 0.20 累积频率 0.10

30 200

0.15 1

0.25 0.65 0.85 1

频率/组距

0

100 200 300 400 500 600 寿命(h)

(3)由频率分布表可以看 出,寿命在 h ~ 400 100 的电子元件出现的频率 : 0.65,所以我们估计电子 为 元件寿命在 h ~ 400h的概率为: 0.65. 100

() 4 .由频率分布表可知,寿 命在400h以上的电子 元件出现的频率为: 0.20 ? 0.15 ? 0.35 ,故我们 估计电子元件寿命在 h以上的概率为: 0.35. 400

高考题型:
广东文 11 题 5 分 11.为了调查某厂工人生产某种产品的能 力,随机抽查了 20 位工人某天生产该产品 的 数 量 . 产品 数 量 的 分组 区 间 为 ?45,55? , 频率/组距 ?55,65? , ?65,75? ,

?75,85? , ?85,95? ,由此得

0.040 0.035 0.030 0.025 0.020 0.015 0.010 0.005 0 产品数量 45 55 65 75 85 图3 95

到频率分布直方图如图 3,则这 20 名工人中一 天生产该产品数量在 ?55,75? 的 人 数 是 .

茎叶图
初中我们学过用平均数、众数和中位数反映总体的 水平,用方差考察稳定程度。

我们还有一种简易的方法,就是将这些数据有条理 的列出来,从中观察数据的分布情况,这种方法就 是茎叶图。
制作茎叶图的方法

将所有两位数的十位数字作为“茎”,个位数字作 为“叶”,茎相同者共用一个茎,茎按从小到大的 顺序从上向下列出,共茎的叶一般按从大到小(或 从小到大)的顺序同行列出。

例1:某篮球运动员在某赛季各场比赛的得 分情况如下:12,15,24,25,31,31,36, 36,37,39,44,49,50 茎叶图: 茎: 十位 数字
1 2

25 45
116679

3
4 5

49
0

叶:表 示个位 数字

注: 1、重复出现的数据要重复记录,不能遗 漏;特别是“叶”部分;

2、所有的信息都可以从这个茎叶图中得到; 3、茎叶图便于记录和表示;

4、不足的是其分析只是粗略的,对差异不 大的两组数据不易分析;表示三位数以上 的数据时不够方便;

例2:甲、乙两篮球运动员上赛季每场比 赛的得分如下,试比较这两位运动员的得 分水平: 甲 12,15,24,25,31,31,36,36, 37,39,44,49,50 乙 8,13,14,16,23,26,28,33, 38,39,51,33,29





0
2 5 0 5 116679 4 9 1 2 3 4

8
3 4 6 3 6 8 9 8913

0

5

1

注:中间的数字表示得分的十位数字。
旁边的数字分别表示两个人得分的个位数。

练习.从甲、乙两品种的棉花中各抽测了 25 根棉花的纤维长度(单位:mm) , 结果如下: 甲品种:271 273 280 285 285 287 292 294 295 301 303 303 307 308 310 314 319 323 325 325 328 331 334 337 352 乙品种:284 292 295 304 306 307 312 313 315 315 316 318 318 320 322 322 324 327 329 331 333 336 337 343 356 由以上数据设计了如下茎叶图
甲 7 5 5 8 7 3 9 8 5 7 3 5 4 3 4 5 4 1 0 2 1 0 3 1 2 27 28 29 30 31 32 33 34 35 4 2 4 2 0 1 3 6 乙

5 6 3 2 3

7 5 5 6 8 8 2 4 7 9 6 7

根据以上茎叶图,对甲、乙两品种棉花的纤维长度作比较,写出两个统计结论: ① ;② .

小 结
图形 优点 缺点

频率分布
直方图

1)易表示大量数据

丢失一些

2)直观地表明分布地 情况 1)无信息损失 茎页图

信息 只能处理样本

2)随时记录方便记录和表示 容量较小数据

课堂小结
表示样本分布的方法:

(1)频率分布表
(2)频率分布图(包括直方图和条形图) (3)频率分布折线图 (4)茎叶图

表示样本的分布的方法: 3.频率分布折线图 1.频率分布表 样本频率分布中, 分组 个数累计 频数 频率 当样本容量无限增 大,组距无限缩小
2.频率分布直方图
频率/组距

样本频率分布直方图接近 于一条光滑曲线——总体 密度曲线,反映了总体分 布。
产品尺寸(mm)

小结
1.总体分布指的是总体取值的频率分布规律,
由于总体分布不易知道,因此我们往往用样本

的频率分布去估计总体的分布。
2.总体的分布分两种情况:当总体中的个体取

值很少时,用茎叶图估计总体的分布;当总体
中的个体取值较多时,将样本数据恰当分组, 用各组的频率分布描述总体的分布,方法是用 频率分布表或频率分布直方图。


相关文章:
2.2.1用样本的频率分布估计总体分布习题(2)
§2.2.1 用样本的频率分布估计总体分布习题典例分析: 例 1 在某小学 500 名学生中随机抽 样得到 100 人的身高如下表 ( 单位 cm) : (1)列出样本频率...
教案§2.2.1用样本的频率分布估计总体分布
§2.2.1 用样本的频率分布估计总体分布汶上一中 丁阳会 2010-3-20 【教材分析】 教材分析】 本节课的主要内容是学习画样本的频率分布直方图和用样本的频率分布...
2.2.1用样本的频率分布估计总体分布
2.2.1用样本的频率分布估计总体分布_数学_高中教育_教育专区。会泽一中教师导讲...请大家思考 :用什么统计图可以直观表示上述数据的分布状况?你能根据上述数据估计...
2.2.1用样本的频率分布估计总体分布(第1课时)
2.2 2.2.1 用样本的频率分布估计总体分布 学案(第 1 课时) 总第 094 课时 执笔人:芦建宾 2010 年 5 月 20 日一、学习目标:学会列频率分布表、画频率...
2.2.1用样本的频率分布估计总体分布课时作业
浠水县校级模拟)已知个样本容量为 100 的样本数据的频率分布直方图如图所示,那么 样本数据落在[40,60)内的样本的频数为 ;估计总体的众数为 . A 100 辆. B...
2.2.1用样本的频率分布估计总体分布习题(1)
典例分析: 例 1 在某小学 500 名学生中随机抽 样得到 100 人的身高如下表 ( 单位 cm) : (1)列出样本频率分布表; (2)画出频率分布直方图; (3)估计该...
导学案 2.2.1 用样本的频率分布估计总体的分布
导学案 2.2.1 用样本的频率分布估计总体的分布_数学_高中教育_教育专区。《样本的频率分布估计总体的分布》 (预习案)使用时间:6 月 13 日 主备人:苍安江 ...
2.2.1用样本的频率分布估计总体分布导学案
高二数学 SX-G2-B3-U2-L2.2.1 2.2.1用样本的频率分布估计总体分布》导学案编写人: 审核:高二数学组 编写时间:2015.10.26 一. 教学目标 (1)通过实例...
2.2.1 用样本的频率分布估计总体分布.导学案
通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地 选择上述方法分析样本的分布,准确地做出总体估计。 【学习重难点】 重点:会列频率分布表,画...
更多相关标签:
用样本估计总体ppt | 样本估计总体 | 用样本估计总体 | 用样本估计总体教案 | 样本均值估计总体均值 | 2.2用样本估计总体 | 样本方差估计总体方差 | 样本比例估计总体比例 |