当前位置:首页 >> 数学 >>

高中数学2.2.1用样本的频率分布估计总体分布


用样本估计总体
2.2.1用样本的频率分布估计总体分布

温故知新
? 1.随机抽样有哪几种基本的抽样方法?

? 简单随机抽样、系统抽样、分层抽样. ? 2.随机抽样是收集数据的方法,如何通过样本数据 所包含的信息,估计总体的基本特征,即用样本估 计总体,是我们需要进一步学习的内容.

频率分布

直方图

问题引入
?

我国是世界上严重缺水的国家之一,城市缺水问题较为突出, 某市政府为了节约生活用水,计划在本市试行居民生活用水定 额管理,即确定一个居民月用水量标准a,用水量不超过a的部 分按平价收费,超出a的部分按议价收费.通过抽样调查,获得 100位居民2007年的月均用水量如下表(单位:t):
2.5 2.6 2.7 2.8 2.9 2.9 2.8 2.7 2.6 2.5 2.0 2.2 2.3 2.3 2.4 2.4 2.3 2.4 2.3 2.2 2.0 2.2 2.1 2.2 2.3 2.4 2.3 2.1 2.1 2.0 1.5 1.5 1.6 1.7 1.8 1.9 1.8 1.7 1.6 1.5 1.0 1.2 1.2 1.3 1.4 1.3 1.3 1.4 1.0 1.0 1.6 0.2 3.7 3.6 3.5 1.4 1.3 1.2 1.0 1.2 1.8 0.4 1.5 1.7 1.9 1.8 1.6 1.5 1.7 1.8 1.9 0.3 0.5 0.6 0.8 0.7 0.9 0.5 0.8 0.6 1.6 0.4 3.8 4.1 4.3 2.0 2.3 2.4 2.4 2.2

3.1 3.4 3.2 3.3 3.2 3.0 2.5 2.6 2.5 2.8

阅读课本66-69页,思考下列问题
? 什么是极差?极差有何作用? ? 怎样确定分组数?组数与样本容量有什么关系?一般

宜设定多少组数? ? 如何确定分点及第一组的起始值? ? 频率分布表有多少列?怎样计算各分组的频率? ? 一般地,列出一组样本数据的频率分布表可以分哪几 个步骤进行? ? 频率分布直方图,横轴表示什么?纵轴表示什么? ? 频率分布直方图,用什么表示频率? ? 频率分布直方图中,各小长方形的面积总和是多少?

极差与分组
? 样本数据中的最大值和最小值的差称为极差.由

极差可以说明样本数据的取值范围. ?N ? ? 设极差为N,组距为d,那么分组数= ? ? ? 1 ?d ?
? 对样本数据进行分组,组距的确定没有固定的标准,

组数太多或太少,都会影响我们了解数据的分布情 况. ? 数据分组的组数与样本容量有关,一般样本容量越 大,所分组数越多.按统计原理,若样本的容量为n, 分组数一般在(1+3.3lgn)附近选取.当样本容量不超 过100时,按照数据的多少,常分成5~12组. 若以0.1或1.5为组距对上述100个样本数据分组合适吗?

分 组 [0,0.5) [0.5,1) [1,1.5) [1.5,2) [2,2.5) [2.5,3) [3,3.5) [3.5,4) [4,4.5] 合计

频数 4 正 8 正 正 正 15 正 正 正 正 22 正 正 正 正 正 25 正 正 14 正 一 6 4 2 100
频数和= 样本容量

频数累计

频率 0.04 0.08 0.15 0.22 0.25 0.14 0.06 0.04 0.02 1.00
频数和=1

频数 频率 ? 样本容量

画频率分布表步骤
? 第一步,求极差.

(极差=样本数据中最大值与最小值的差) ? 第二步,决定组距与组数. (设k=极差÷组距,若k为整数,则组数=k,否则, 组数=k+1) ? 第三步,确定分点,将数据分组. ? 第四步,统计频数,计算频率,制成表格 . (频数=样本数据落在各小组内的个数, 频率=频 数÷样本容量)

深入理解
? 上表称为样本数据的频率分布表,由此可以推测该市

全体居民月均用水量分布的大致情况,给市政府确定 居民月用水量标准提供参考依据,这里体现了一种什 么统计思想? ? 用样本的频率分布估计总体分布. ? 如果市政府希望85%左右的居民每月的用水量不超过 标准,根据上述频率分布表,你对制定居民月用水量 标准(即a的取值)有何建议? ? 88%的居民月用水量在3t以下,可建议取a=3.
? 在实际中,取a=3t一定能保证85%以上的居民用水不

超标吗?哪些环节可能会导致结论出现偏差? ? 组距的大小可能导致结论出现偏差。实践中,对统 计结论是需要进行评价的.

频率分布直方图
? 为了直观反映样本数据在各组中的分布情况,我们

将上述频率分布表中的有关信息用下面的图形表示:
频率 组距
0.5 0.4 0.3 0.2 0.1
O

高度 ?

频数 组距

各小长方形的 面积和=1

各小长方形的 面积=频率 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t

宽度:组距 注意横轴和纵轴表示什么

画频率分布直方图的步骤
? ? ?

第一步,画平面直角坐标系. 第二步,在横轴上均匀标出各组分点,在纵轴上标出单位长度. 第三步,以组距为宽,各组的频率与组距的商为高,分别画出 各组对应的小长方形. 频率 组距 频率分布直方图非常直观地表明 了样本数据的分布情况,使我们 能够看到频率分布表中看不太清 楚的数据模式,但原始数据不能 在图中表示出来.你能根据上述 频率分布直方图指出居民月均用 水量的一些数据特点吗?

0.5 0.4 0.3 0.2 0.1
O

0.5 1 1.5 2 2.5 3 3.5 4 4.5

月均用水量/t

频率 组距 0.5 0.4 0.3 0.2 0.1
O

知识拓展

0.5 1 1.5 2 2.5 3 3.5 4 4.5

月均用水量/t

? 居民月均用水量的分布是“山峰”状的,且是“单峰”

的 ? 大部分居民的月均用水量集中在一个中间值附近,只 有少数居民的月均用水量很多或很少 ? 居民月均用水量的分布有一定的对称性等 ? 现实中许多数据的分布都有上述特点,如身高、体重、 考试成绩、作物产量……近似“正态分布”

影响图形状的因素
? 对一组给定的样本数据,频率分布直方图的外观形状

与哪些因素有关?在居民月均用水量样本中,你能以 1为组距画频率分布直方图吗? ? 与分组数(或组距)及坐标系的单位长度有关 .

0.4 0.3 0.2 0.1
O

频率 组距

1

2

3

4

5 月均用水量/t

若以0.1或1.5为组距,图的形状会变如何?

举例
其年龄分别如下: 42,38,29,36,41,43,54,43,34,44, 40,59,39,42,44,50,37,44,45,29, 48,45,53,48,37,28,46,50,37,44, 42,39,51,52,62,47,59,46,45,67, 53,49,65,47,54,63,57,43,46,58. ? (1)列出样本频率分布表; ? (2)画出频率分布直方图; ? (3)估计年龄在32~52岁的知识分子所占的比例约是 多少.

? 某地区为了了解知识分子的年龄结构,随机抽样 50名,

(1)极差为67-28=39,取组距为5,分为8组. 样本频率分布表: 分 组 频数 频率 [27,32) 3 0.06 [32,37) 3 0.06 [37,42) 9 0.18 [42,47) 16 0.32 [47,52) 7 0.14 [52,57) 5 0.10 [57,62) 4 0.08 [62,67) 3 0.06 合 计 50 1.00

(2)样本频率分布直方图:
频率 组距

0.06 0.05 0.04 0.03 0.02 0.01
O 27 32 37 42 47 52 57 62 67 年龄

(3)因为0.06+0.18+0.32+0.14=0.7, 故年龄在32~52 岁的知识分子约占70%.

频率分布折线图 茎叶图

阅读课本69-70页,思考下列问题
? 由频率分布条形图,如何得到频率分布折线图?
? 由频率分布折线图,如何得到总体密度曲线? ? 总体密度曲线有什么作用?

? 总体密度曲线是否一定存在?是否唯一?能否由样

本数据得到准确的总体密度曲线? ? 茎叶图用来表示什么? ? 怎样绘制茎叶图?如何区分“茎”与“叶”是哪些 数? ? 茎叶图有什么优点?

频率分布折线图
? 在频率分布直方图中,依次连接各小长方形上端的中

点,就得到一条折线,这条折线称为频率分布折线图 . ? 频率分布折线图能大致反映样本数据的频率分布 .
频率 组距 0.5 0.4 0.3 0.2 0.1
O

随着样本容量的增加,作 图时所分的组数增多,组 距减少,你能想象出相应 的频率分布折线图会发生 什么变化吗?
月均用水量/t

0.5 1 1.5 2 2.5 3 3.5 4 4.5

总体密度曲线
? 随着样本容量的增加,作图时所分的组数增多,组

距减少,相应的频率分布折线图越来越接近于一条 光滑曲线,统计中称这条光滑曲线为总体密度曲线. 频率 阴影部分的面积,表示 组距 总体在区间(a,b)内取值 的百分比.

O

a

b 月均用水量/t

茎叶图
? 频率分布表、频率分布直方图和折线图的主要作用

是表示样本数据的分布情况,茎叶图也是表示样本 数据的分布情况.
甲、乙两名篮球运动员每场比赛的得分情况如下: 甲得分:13,51,23,8,26,38,16,33,14,28,39; 乙得分:49,24,12,31,50,31,44,36,15,37,25,36,39.

甲 4 3 3 6 6 8 8 3 8 9 0 1 2 3 4 5



1

2 5 1 4 0

5 4 6 9

1

6

7

9

茎叶图的“茎”与“叶”及步骤
? 第一步,将每个数据分为“茎”(高位)和“叶”(低

位)两部分; ? 第二步,将最小的茎和最大的茎之间的数按大小次序排 成一列; ? 第三步,将各个数据的叶按大小次序写在茎右(左)侧 .
甲 8 4 6 3 3 6 8 3 8 9 1 乙

0 1 2 3 4 5

2 5 1 4 0

5 4 6 1 6 9

7 9

你能通过该图说明哪个运 动员的发挥更稳定吗?

茎叶图举例
? 对于样本数据:3.1,2.5,2.0,0.8,1.5,1.0,4.3,

2.7,3.1,3.5,用茎叶图如何表示?

茎 0 1 2 3 4

叶 8 0 5 0 5 7 1 1 5 3

茎叶图的优缺点
? 优点:

? 保留了原始数据,没有损失样本信息; ? 数据可以随时记录、添加或修改. ? 缺点: ? 不适合样本容量很大或茎、叶不分明的样本数据. ? 比较茎叶图和频率分布表,茎叶图中“茎”和“叶” 的数目分别与频率分布表中哪些数目相当? ? 茎相对应分组 ? 叶相对应频数

练习
? 在某小学500名学生中随机抽样得到100人的身高如下

表(单位cm) :
身高区间 人 数 [122,126) [126,130) [130,134) [134,138) [138,142) 2 8 9 18 28

身高区间 人 数

[142,146) [146,150) [150,154) [154,158) 15 10 6 4

? (1)列出样本频率分布表; ? (2)画出频率分布直方图; ? (3)估计该校学生身高小于134cm的人数约为多少?

(1)频率分布表:
分 组 频数 频率

[122,126) [126,130) [130,134) [134,138) [138,142) [142,146) [146,150) [150,154) [154,158)
合 计

2 8 9 18 28 15 10 6 4
100

0.02 0.08 0.09 0.18 0.28 0.15 0.10 0.06 0.04
1.00

(2)频率分布直方图:
频率 组距

0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01
O
122 126 130 134 138 142 146 150 154 158

身高/cm

(3)(0.02+0.08+0.09)×500=95(人)

为了了解高一学生的体能情况,某校随机抽取部分学生进 行一分钟跳绳次数测试,将所得数据整理后,画出了频率 分布直方图.图中从左到右各小长方形的面积之比为2:4: 17:15:9:3,第二小组的频数为12. (1)第二小组的频 频率/组距 率是多少? 0.036 (2)样本容量是多 0.032 少? 0.028 (3)若次数在110以 0.024 上(含110次)为达 0.020 0.016 标,试估计该校全体 0.012 高一学生的达标率约 0.008 是多少?
0.004 o
90 100 110 120 130 140 150 次数

小结
1.用样本的频率分布估计总体分布,当总体中的个体数取值很 少时,可用茎叶图估计总体分布;当总体中的个体数取值较多 时,可将样本数据适当分组,用频率分布表或频率分布直方图 估计总体分布. ? 2.频率分布是指一个样本数据在各个小范围内所占比例的大小, 总体分布是指总体取值的频率分布规律.我们通常用样本的频率 分布表或频率分布直方图去估计总体的分布. ? 3.频率分布表和频率分布直方图,是对相同数据的两种不同表 达方式.用紧凑的表格改变数据的排列方式和构成形式,可展示 数据的分布情况.通过作图既可以从数据中提取信息,又可以利 用图形传递信息. ? 4总体密度曲线可看成是函数的图象,对一些特殊的密度曲线, 其函数解析式是可求的. ? 5.茎叶图中数据的茎和叶的划分,可根据样本数据的特点灵活 决定.
?


相关文章:
2.2.1用样本的频率分布估计总体分布习题(2)
§2.2.1 用样本的频率分布估计总体分布习题典例分析: 例 1 在某小学 500 名学生中随机抽 样得到 100 人的身高如下表 ( 单位 cm) : (1)列出样本频率...
教案§2.2.1用样本的频率分布估计总体分布
教案§2.2.1用样本的频率分布估计总体分布_高一数学_数学_高中教育_教育专区。2010年3月汶上一中优质课比赛 §2.2.1 用样本的频率分布估计总体分布汶上一中 丁...
高中数学必修3 2.2.1用样本的频率分布估计总体分布
滏春中学高一年级数学必修 3 导学案 课题:2.2.1 用样本的频率分布估计总体分布 第 1 课时 编制:冯新华 校审:冯静 使用时间: 【教师寄语】古之成大事者,不...
2015高中数学 2.2.1用样本的频率分布估计总体分布总结 新人教A版必修3
2015高中数学 2.2.1用样本的频率分布估计总体分布总结 新人教A版必修3_数学_高中教育_教育专区。2.2.1 用样本的频率分布估计总体分布(结)列频率分布表、画...
高中数学必修3人教A§2.2.1用样本的频率分布估计总体分布习题
高中数学必修3人教A§2.2.1用样本的频率分布估计总体分布习题_数学_高中教育_教育专区。典例分析: 例 1 在某小学 500 名学生中随机抽 样得到 100 人的身高如...
2015高中数学 2.2.1 用样本的频率分布估计总体分布练习 新人教A版必修3
2015高中数学 2.2.1 用样本的频率分布估计总体分布练习 新人教A版必修3_数学_高中教育_教育专区。2.2.1 用样本的频率分布估计总体分布(练)一、选择题 1....
高中数学 (2.2.1 用样本的频率分布估计总体分布)教案 新人教A版必修3
高中数学 (2.2.1 用样本的频率分布估计总体分布)教案 新人教A版必修3_数学_...(让学生展开讨论) (2)什么是频率分布? (3)画频率分布直方图有哪些步骤? (4...
高中数学 2.2.1用样本的频率分布估计总体分布学案 新人教A版必修3
高中数学 2.2.1用样本的频率分布估计总体分布学案 新人教A版必修3_数学_高中教育_教育专区。高中数学必修三学案:2.2.1 用样本的频率分布估计总体分布学习目标 ...
2.2.1用样本的频率分布估计总体分布
2.2.1用样本的频率分布估计总体分布_数学_高中教育_教育专区 暂无评价|0人阅读|0次下载|举报文档 2.2.1用样本的频率分布估计总体分布_数学_高中教育_教育专区...
更多相关标签:
用样本估计总体ppt | 样本估计总体 | 用样本估计总体 | 用样本估计总体教案 | 样本均值估计总体均值 | 2.2用样本估计总体 | 样本方差估计总体方差 | 样本比例估计总体比例 |