当前位置:首页 >> 数学 >>

用样本的数字特征估计总体的数字特征(一)


问题提出
1.对一个未知总体,我们已经学过的用样本分布估计总 体分布的方法有哪些? 2.它们各有什么优缺点?

频率分布表和频率分布直方图能够很容易表示大量数 据,非常直观地表明其分布形状,使我们能够看到许多 隐藏在数据后的信息,但是,损失了一些样本数据的信 息,不能保留原有数据。 茎时图由所有样本数据组成,没有损失任何样本信息, 可以在抽样过程中随

时记录,但是,只能适用于样本容 量较小时。 3.对于样本容量较大的样本,为了从整体上更好地把握 总体规律,我们该如何处理呢?

2.2.2 用样本的数 字特征估计总体的 数字特征(一)

一 众数、中位数、平均数的概念
众数:在一组数据中,出现次数最多 的数据叫做这组数据的众数.
中数:将一组数据按大小依次排列, 把处在最中间位置的一个数据(或最中 间两个数据的平均数)叫做这组数据的 中位数. 平均数: 一组数据的算术平均数,即 x=
1 ( x1 ? x 2 ? ? ? x n ) n

复习运用
从甲、乙、丙三个厂家生产的同一件产品中抽取 8 件 产品,对其寿品进行跟踪调查结果如下(单位:年) : 甲:3,4,5,6,8,8,8,10; 乙:4,6,6,6,8,9,12,13; 丙:3,3,4,7,9,10,11,12; 三个厂家在广告中都称该产品的使用寿命是 8 年, 请 根据结果判断厂家在广告中分别运用了平均数、众数、 中位数中哪一种集中趋势的特征数: 众数 中位数 平均数 甲:________,乙:_________,丙:_________。

探究1:众数、中位数和平均数
思考1:如何从频率分布直方图中估计众数、中位数、平 均数?

思考2:在城市居民月均用水量样本数据的频率分布直方 图中,你认为众数应在哪个小矩形内?由此估计总体的众 数是什么?

频率 0.5 组距 0.4 0.3 0.2 0.1
O

取最高矩形下端 中点的横坐标 2.25作为众数.

0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t

思考3:在频率分布直方图中,每个小矩形的面积表示什么? 中位数左右两侧的直方图的面积应有什么关系? 思考4:在城市居民月均用水量样本数据的频率分布直方 图中,从左至右各个小矩形的面积分别是0.04,0.08, 0.15,0.22,0.25,0.14,0.06,0.04,0.02.由此估计 总体的中位数是什么? 频率
0.5 0.4 0.3 0.2 0.1 O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 组距

月均用水量/t

0.5-0.04-0.08-0.15-0.22=0.01,设小矩形的宽为X,则: 0.5X=0.01,得X=0.02,所以中位数是2+0.02=2.02.

思考5:平均数是频率分布直方图的“重心”,在下面的 频率分布直方图中,各个小矩形的重心在哪里?从直方图 估计总体在各组数据内的平均数分别为多少?
0.5 0.25,0.75,1.25, 0.4 1.75,2.25,2.75, 0.3 3.25,3.75,4.25. 0.2 月均 0.1 用水量/t O 0.5 1 1.5 2 2.5 3 3.5 4 4.5
频率 组距

样本数据的估计平均数就是将频率分布直方图中每个小矩 形的面积与小矩形底边中点的横坐标之积相加. 由此估计 总体的平均数就是 0.25×0.04+0.75×0.08+1.25×0.15+1.75×0.22+2.25 ×0.25+2.75×0.14+3.25×0.06+3.75×0.04+4.25×0.0 2

思考6:从居民月均用水量样本数据可知,该样本的众数 是2.3,中位数是2.0,平均数是1.973,这与我们从样本频 率分布直方图得出的结论有偏差,你能解释一下原因吗? 在制作频率分布直方图“丢失”了一些样本数据, 得到的是一个估计值,且所得估计值与数据分组有关.

注:在只有样本频率分布直方图的情况下,才可按上述方 法估计众数、中位数和平均数,并由此估计总体特征.

思考7:一组数据的中位数一般不受少数几个极端值的影

响,在某些情况下是一个优点,但它对极端值的不敏感有 时也会成为缺点,你能理解下例中“我们单位的收入水平 比别的单位高”这句话的含义? 样本数据的平均数大于(或小 于)中位数说明什么问题?

平均数大于(或小于)中位数,说明样本数据中存在 许多较大(或较小)的极端值. 这句话具有模糊性甚至蒙骗性,其中收入水平是员工 工资的某个中心点,它可以是众数、中位数或平均数.

二、三种数字特征的优缺点:
1、众数体现了样本数据的最 大集中点,但它对其它数据信息的 忽视使得无法客观地反映总体特征。
如上例中众数是2.25t,它告诉 我们,月均用水量为2.25t的居民数 比月均用水量为其它数值的居民数 多,但它并没有告诉我们多多少。

2、中位数是样本数据所占频率的 等分线,它不受少数几个极端值的影响, 这在某些情况下是优点,但它对极端值 的不敏感有时也会成为缺点。
如上例中假设有某一用户月均用水 量为1000t,那么它所占频率为0.01,几 乎不影响中位数,但显然这一极端值是 不能忽视的。

3、由于平均数与每一个样本的 数据有关,所以任何一个样本数据的 改变都会引起平均数的改变,这是众 数、中位数都不具有的性质。

与众数、中位数比较起来,平均数可 以反映出更多的关于样本数据全体的信息, 但平均数受数据中的极端值的影响较大, 使平均数在估计时可靠性降低。

三种数字特征的优缺点
特征数 众数 中位数 平均数 优 点 缺 点
体现了样本数据的最大 无法客观反映总体 特征 集中点 不受少数极端值的影响 不受少数极端值的 影响有时也是缺点 与每一个数据有关,更 受少数极端值的影 能反映全体的信息. 响较大,使其在估 计总体时的可靠性 降低.

生活决策中的应用: 体育\文艺比赛中,使用的是平均分. 同时去掉一个最高分和最低分,从而降 低误差,保证公平

练习(课本第74页)

答:应该采用平均数来表示每一个国家项目 的平均金额,因为它能反映所有项目的信息。但 平均数会受到极端数据2200万元的影响,所以大 多数项目投资金额都和平均数相差比较大。

三 、 众数、中位数、平均数的简单应用 例1 某工厂人员及工资构成如下:
人员
周工资 人数 合计

经理
2200 1 2200

管理人员 高级技工
250 6 1500 220 5 1100

工人
200 10 2000

学徒
100

合计

1 23 100 6900

(1)指出这个问题中周工资的众数、中 位数、平均数 (2)这个问题中,工资的平均数能客观 地反映该厂的工资水平吗?为什么?

分析:众数为200,中位数为220,
平均数为300。
因平均数为300,由表格中所列出的数据 可见,只有经理在平均数以上,其余的人 都在平均数以下,故用平均数不能客观真 实地反映该工厂的工资水平。

例2 下面是某校学生日睡眠 时间的抽样频率分布 表?单位 : h ?, 试估计该校学生的日平 均睡眠时间 .

睡眠时间

人 数 5 17 33 37 6 2 100

频 率 0.05 0.17 0.33 0.37 0.06 0.02 1

?6,6.5 ? ?6.5,7? ?7,7.5 ? ?7.5,8 ? ?8,8.5 ? ?8.5,9?
合 计

分析 要确这100 名学生的平均睡 眠 时间, 就 必须 计算其总睡眠时间.由于每组中的个体睡眠时间只 是一个范围, 可以用各组区间的组中值近似地表示 .

解法1 总睡眠时间约为 6.25 ? 5 ? 6.75 ?17 ? 7.25 ? 33 ? 7.75 ? 37 ? 8.25 ? 6 ?8.75 ? 2 ? 739 ? h ? .
故平均睡眠时间约为7.39 h .
解法 2 求组中值与对应频率之积的和 6.25 ? 0.05 ? 6.75 ? 0.17 ? 7.25 ? 0.33 ? 7.75 ? 0.37 ? 8.25 ? 0.06 ? 8.75 ? 0.02 ? 7.39 ?h ?.

答 估计该校学生的日平均睡眠时间约为7.39 h .

例 3 某单位年收入在10 000 到15000、 15000 到20000、 20000到25000、 25000到 30000、 30000 到35000、 35000到 40000及40000到 50000 元之 间的职工所占的比例分别为10%,15%,20 %, 25%,15%,10% 和5%试估计该单位职工的平 均年收入.

解 估计该单位职工的平均 年收入为 12500? 10 % ? 17500? 15 % ? 22500? 20 % ? 27500? 25 % ? 32500? 15 % ? 37500? 10 % ? 45000? 5 % ? 26125?元?.

答 估计该单位人均年收入 约为26125 . 元

练习:”八.一”前夕,某中学举行国防知识竞赛:满分为 100分,80分以上为优秀,现将高一的两个班参赛学生的 成绩进行整理后分成五组绘制成如图所示的频率分布直 方图,已知图中从左到右的第一、第二、第三、第四、 第五小组的频率分别是0.3,0.4,0.15,0.1,0.05 求:(1)成绩的众数、 中位数; (2)平均成绩
0.04 0.03

(1)65,65 (2)67

0.015 0.010 0.005

0

50 60 70

80 90

100

复习回顾 1、频率分布直方图估计众数、中位数、平均数 2、三种数字特征的优缺点
特征数 众数 中位数 平均数 优 点
体现了样本数据的 最大集中点 不受少数极端值的 影响

缺 点
无法客观反映总体特 征 不受少数极端值的影 响有时也是缺点

与每一个数据有关, 受少数极端值的影响 更能反映全体的信 较大,使其在估计总 息. 体时的可靠性降低.

在频率分布直方图中估计众数、中位数、平均数

实例引入 甲.乙两名射击队员,在进行的十次射击中成绩分 别是: 甲:10; 9; 8; 10; 8; 8; 10; 10; 9.5; 7.5

乙:9; 9; 8.5; 9; 9; 9.5; 9; 9; 8.5; 9.5 试问二人谁发挥的水平较稳定?
分析:甲的平均成绩是9环.乙的平均成绩也是9环.

为了对两人射击水平的稳定程度做个合理 的评价,这里我们引入了一个新的概念,方差和 标准差.

知识探究:标准差、方差 自主学习教材74页----78页内容,交流回答:
1、平均数相等的两组数据是否没有差异?用什么 来反映? 2、标准差的计算公式是什么? 3、标准差反映样本数据的什么特征?标准差越大 时样本数据怎样变化? 4、标准差的取值范围是什么?标准差为0的样本 数据有什么特点? 5、方差的计算公式是什么?方差与标准差的关系 是什么?

1、平均数相等的两组数据是否没有差异?用什么 来反映? 2、标准差的计算公式是什么?
样本标准差的计算公式为:

1 2 2 2 s ? [( x1 ? x) ? ( x2 ? x) ? ? ? ( xn ? x) ] n

3、标准差反映样本数据的什么特征?标准差越大 时样本数据怎样变化? 标准差是样本数据到平均数的一种平均 距离.它用来描述样本数据的离散程度.在实际 应用中,标准差常被理解为稳定性. 标准差较大,数据的离散程度较大;标准差 较小,数据的离散程度较小。

4、标准差的取值范围是什么?标准差为0的样本 数据有什么特点? 标准差S=0,意味着所有的样本数据都等于 样本平均数。 5、方差的计算公式是什么?方差与标准差的关系 是什么? 1 2 2 2 2 s ? [( x1 ? x ) ? ( x2 ? x ) ? ? ? ( xn ? x ) ] n 在刻画样本数据的分散程度上,方差和标准 差是一样的,但在解决实际问题时,一般多采用标 准差。

理论迁移
例1:画出下列四组样本数据的直方图,说明 它们的异同点.

(1)

(2)

(3)

(4)

例2:甲乙两人同时生产内径为25.40mm的一种零件. 为了对两人的生产质量进行评比,从他们生产的零件中 各抽出20件,量得其内径尺寸如下(单位:mm ) 甲
X甲≈25.401 s甲≈0.037



X乙≈25.406 S乙≈0.068

从生产的零件内径的尺寸来看,谁生产的质量较高?

达标检测

课本P79 练习

解: 依题意计算可得

x1=900

x2=900

s1≈23.8

s2 ≈42.6

甲乙两种水稻6年平均产量的平均数相同,但 甲的标准差比乙的小,所以甲的生产比较稳定.

解 : (1) 平均重量约为496.86 g , 标准差约为6.55

(2)重量位于(x-s , x+s)之间有14袋白糖,所占 百分比为66.67%.

解:平均数x≈19.25, 中位数为15.2, 标准差s≈12.50. 这些数据表明这些国家男性患该病的平均死亡率约为 19.25, 有一半国家的死亡率不超过15.2, x > 15.2 说 明存在大的异常数据, 这些异常数据使得标准差增大.

4、(教材81页4)若甲、乙两队比赛情况如下, 下列说法哪些说法是不正确的:
平均失球数 甲 1. 5 平均失球个数的标准差 1. 1



2. 1

0. 4

1、平均来说,甲的技术比乙的技术好; 2、乙比甲技术更稳定; 3、甲队有时表现差,有时表现好; 4、乙队很少不失球。

全对

归纳延伸
1.用样本的数字特征估计总体的数字特征分两类: (1)用样本平均数估计总体平均数。 (2)用样本标准差估计总体标准差。样本容量越大,估 计就越精确。 2.平均数对数据有“取齐”的作用,代表一组数据的平 均水平. 3.标准差描述一组数据围绕平均数波动的大小,反映 了一组数据变化的幅度 。

课后作业

1、P81A组1、6
2、预习作业 两个变量的线性相关

(相关关系的概念,散点图,正相 关,负相关。回答课本84思考85页练 习)


相关文章:
用样本的数字特征估计总体的数字特征的教学反思
用样本的数字特征估计总体的数字特征》教学反思今天开课的课题是《用样本的数字特征估计总体的数字特征》 ,这节课我主要是 从学生的现有认知水平出发,利用问题...
用样本的数字特征估计总体的数字特征(精品数学教案)
为了从整体上更好地把握总体的规律,我们要 通过样本的数据对总体的数字特征进行研究。——用样本的数字特征估计总体的数字特征(板出课题) 。 【探究新知】 <一>...
样本的数字特征估计总体的数字特征 练习题
样本的数字特征估计总体的数字特征 练习题_高一数学_数学_高中教育_教育专区。限时练 093 一、选择题 1.某学习小组在一次数学测验中,得 100 分的有 1 人,95 ...
用样本的数字特征估计总体的数字特征同步练习题
锦山蒙中学案(高二年级组)班级课题姓名学科时间 用样本的数字特征估计总体的数字特征同步练习题 过程 双色笔纠错 一、选择题: 1.关于平均数、 中位数、 众数的...
用样本的数字特征估计总体的数字特征
用样本的数字特征估计总体的数字特征_其它课程_高中教育_教育专区。用样本的数字...答案:C 4.一组数据的平均数是 2.8,方差是 3.6,若将这组数据中的每一个...
用样本的数字特征估计总体的数字特征
用样本的数字特征估计总体的数字特征_数学_高中教育_教育专区。用样本的数字特征...结合此问题谈一 谈你的看法. 【思路探究】 解答本题先用公式求出平均数,再...
用样本的数字特征估计总体的数字特征
用样本的数字特征估计总体的数字特征_数学_高中教育_教育专区。学案临朐...方差和标准差的意义:描述一个样本和总体的波动大小的特征数。标准差大说明波动...
用样本的数字特征估计总体的数字特征(一)
2.2.2 一、基础过关 用样本的数字特征估计总体的数字特征(一) 1.已知 10 名工人生产同一零件,生产的件数分别是 16,18,15,11,16,18,18,17,15,13,设其...
2.2.2 用样本的数字特征估计总体的数字特征
2.2.2 用样本的数字特征估计总体的数字特征2.2.2 用样本的数字特征估计总体...进 一步,可以解释对总体众数、总体中位数和总体平均数的两种不同估计方法的...
更多相关标签:
用样本估计总体ppt | 样本估计总体 | 用样本估计总体 | 用样本估计总体教案 | 样本均值估计总体均值 | 2.2用样本估计总体 | 样本方差估计总体方差 | 样本比例估计总体比例 |