当前位置:首页 >> 高中教育 >>

抽样调查课件(2)


第二章 简单随机抽样

1

本章主要内容
? ? ? ? ?

2.1 2.2 2.3 2.4 2.5

概述 简单估计量及其性质 比率估计量及其性质 回归估计量及其性质 简单随机抽样的实施

2

2.1 概述
? ? ? ? ? ?



2.1.1 随机抽样的几点约定 2.1.2 简单随机抽样的意义和原则 2.1.3 简单随机抽样的定义 2.1.4 简单随机抽样的符号 2.1.5 对总体特征估计的思路和方法 2.1.6 简单估计的主要参数和统计量
3

2.1.1 随机抽样的几点约定
?

随机抽样具体分为4种情形: 所有可能样本数最多, 但理论结果最简单。 放回有序 放回无序 所有可能样本数最少, 不放回有序 实际操作最简单。 不放回无序 本书的内容是围绕不放回简单随机抽样展开的。

?

除非特别说明,简单随机抽样是指不放回简单 随 机 抽 样 ( Simple random sampling without replacement 记为SRSWOR) 。

4

放回简单随机抽样(SRS with replacement)
?

放回简单随机抽样在每次抽取样本单元时,

都将前一次抽取的样本单元放回总体,因此,
总体的结构不变,抽样是相互独立进行的, 这一点是它与不放回简单随机抽样的主要不 同之处。
?

放回简单随机抽样的样本量不受总体大小的

限制,可以是任意的。

5

【例2.1】
?

设总体有5个单元(1、2、3、4、5),按放回简

单随机抽样的方式抽取2个单元,则所有可能的样 本为25个(考虑样本单元的顺序):
1,1 1,2 1,3 1,4 1,5 2,1 2,2 2,3 2,4 2,5 3,1 3,2 3,3 3,4 3,5 4,1 4,2 4,3 4,4 4,5 5,1 5,2 5,3 5,4 5,5

6

不放回简单随机抽样(SRS without replacement)
?

当从总体N个抽样单元中依次抽取n个抽样
单元时,每个被抽中的单元不再放回总体,

而是从总体剩下的单元中进行抽样。
?

不放回简单随机抽样的样本量要受总体大 小的限制。

?

在实际工作中,更多的采用不放回简单随
机抽样。

7

【例2.2】
?

设总体有5个单元(1、2、3、4、5),按不放 回(无序)简单随机抽样的方式抽取2个单元, 则所有可能的样本为10个: 1,2 1,3 2,3 2,4 3,4 3,5 4,5

1,4 1,5

2,5

8

除非特别说明,本书此后所讨论的总体是: (1)具体总体; (2)有限总体; (3)与抽样框存在一一对应的实查总体,或被称为 抽样总体的抽样框本身。 ? 本书所讨论的单元总是指构成抽样总体的抽样单元 (或称样品、样本点),抽样单元并不总是等同于 个体,有时抽样单元甚至可能包含几个或很多个个 体,这意味着个体是最小的不可再分的单元。 ? 在简单随机抽样中,每个抽样单元就是个体。
?

9

?

?

设抽样总体由N个抽样单元组成,N 是一个已知的 正整数,表示总体规模;设 n 是样本容量,它是 一个不大于N、不小于1的正整数(1≤n≤N,但通 常情况下是1<n<N),表示样本中所包含的单元数, 简称样本量或样品数,表示样本规模。 从N个单元里抽取n个单元进行调查,并根据调查 结果得到的统计量去估计总体的数量特征,就是抽 样调查。

?

样本容量相对于总体规模的比例
记为 f ;通常情况下,0< f <1。

n N

称为抽样比,

10

2.1.2简单随机抽样的意义和原则
? ?

?

?

简单随机抽样的意义: 简单随机抽样是直接用样本均值估计总体均值,待 估参数与用于估计的统计量两者“同形同构”,通 常视为简单估计。 简单随机抽样也称为纯随机抽样,是直接从总体中 (而不是层之类的子总体)抽取个体(而不是群之 类的大单元),是最基本的抽样方法,从理论上讲 最符合随机原则,是其他各种抽样方法的基础和核 心内容。 简单随机抽样操作简单,应用广泛。

11

?

简单随机抽样的缺点:
? ? ?

N 很大时难以获得抽样框 样本分散不易实施,调查费用高 总体内部个体之间变量值差异悬殊时误差会增大
N 不很大的均匀总体 很少单独使用,一般结合其他方法使用 没有其他信息时使用 多变量复杂数据分析

?

简单随机抽样的适用场合:
? ? ? ?

12

简单随机抽样的抽取原则:
?

?

?

(1)按随机原则取样,排除任何主观因素的影响,防 止出现系统误差; (2)每个抽样单元被抽中的概率都是已知的或事先确 定的; (3)每个抽样单元被抽中的概率都是相等的,即简单随 机抽样属于等概率抽样。
所有可能样本每个样 本被抽中的概率相同 每个单元被抽中的 概率相同

13

2.1.3 简单随机抽样的定义
?

定义2.1 从总体的N个单元中,一次整批抽取n个单 元,使得任何一个单元被抽中的概率都相等,任何 n个不同单元组成的组合被抽中的概率也都相等, 这种抽样称为简单随机抽样。

?

定义2.2 从总体的N 个单元中,逐个不放回地抽取 单元,每次抽取到尚未入样的任何一个单元的概率 都相等,直到抽足 n 个单元为止,这样所得的 n

个单元组成一个简单随机样本,这种抽样方法就是 简单随机抽样。

14

有 限 定义2.3 从总体的 N 个单元中抽取 n 个单元的所有 n n 可能不同的组合构造所有可能的 CN 个样本,从 CN 个样本随机抽取1个样本,使每个样本被抽中的概率 n 1 C,这种抽样称为简单随机抽样。 都等于 N 事实上,当 N 和 n 都较大时,依照定义2.3进行抽样 n CN 很大,要列出全部可 是很不方便的,因为此时 能的样本是不现实的。(例如,N=10000,n=400的抽 样只能算是中等规模的抽样,但所有可能的样本有 3.29×101438 多个,已属天文数字。) ? 实际中,简单随机抽样是按照定义2.1和2.2设计的。
?

?

15

2.1.4 简单随机抽样中的符号

? ?

大写符号表示总体的有关变量 用小写符号表示样本的有关变量

16


Y ? 1 N
N


? Y1 ? Y2 ? ? ? YN N y?





?Y
i ?1

N

i

y ? y ? ? ? yn 1 n ? yi ? 1 2 n n i ?1 ? y1 ? y2 ? ? ? yn

Y ? ? Yi ? Y1 ? Y2 ? ? ? YN
i ?1

?y
i ?1

n

i

A 1 P? ? N N

?Y
i ?1

N

i

Yi ? 0或 1

p?

a 1 n ? ? yi n n i ?1 1 n 2 ? ? yi ? y ? n ? 1 i ?1

yi ? 0或 1

1 N N 2 S ? ? ?Yi ? Y ? ? N ? 1 ? 2 N ? 1 i ?1
2

s2 ?

R?

? Yi ?X
i ?1 i ?1 N i

N

Y Y ? ? X X

? R?

?y ?x
i ?1 i ?1 n

n

i

?

y x

i

17

?

总体指标值上面带符号“^”的表示由样
本得到的总体指标的估计。

?

估计量的方差用大写的V表示, 对 V ?Y ? 的 ? ? ? ? 样本估计,不用 V Y 而用 v Y 表示。

??

??

18

2.1.5 对总体特征估计的思路和方法
?

两种思路和方法:
?

?

直接估计:不借助任何辅助变量,仅仅通过 变量的样本观察值对其总体特征进行直接估 计,即样本特征的线性组合表示总体特征, 故统称线性估计。 间接估计:借助相关辅助变量,对我们所感 兴趣的变量的总体特征进行间接估计,用样 本特征的非线性组合表示总体特征,故统称 为非线性估计。

?

对简单随机抽样进行直接估计,称为简单 线性估计,简称简单估计。

19

2.1.6 简单估计的主要参数和统计量
?(1)均值估计:
n ? ? y?1 Y ? yi n i ?1

?(2)总值估计:
?(3)比例估计:

N ? Y ?N y? n

?y
i ?1

n

i

n ? ? ? p ? a ? 1 ? y ? y ?Y P i n n i ?1

?(4)比率估计:

y ? R?r ? ? x

?y ?x
i ?1 i ?1 n

n

i

i

20

2.2 简单估计量及其性质
?

2.2.1 对总体均值的简单估计 2.2.2 对总体比例的简单估计
2.2.3 对总体总量的简单估计

?

?

21

2.2.1 对总体均值的估计
? ?

一、简单估计及其无偏性 在没有其它信息的条件下,对总体均值的 简单估计为: ? yi y? n 抽样理论证明样本平均数是总体均值的 有效、无偏估计量。 可以证明:教科书p32-34。

?

?

22

二、简单估计量的方差
数理统计中定义有限总体的方差为:

? ? E ?Yi ? Y ?
2

2

1 ? N

? ?Y ? Y ?
N i ?1 i

2

抽样理论中所使用的方差为:

S

2

N 1 ? ? ?Yi ? Y N ? 1 i ?1

?

2

23

简单随机抽样中 y 的方差

N ? n 2 1? f 2 V ?y? ? S ? S Nn n
所有的统计量都是随机变量,可能的样本有很多 个,样本不同,统计量就不同,但总体参数是唯一的 确定的。由于样本出现的偶然性,样本均值与总体均 值之间必然有误差, y 的方差即是所有可能的样本均 值与总体均值的误差的方差。
V ? y ? 是一个表达抽样误差的确定型变量,是抽样

精度的理论表达。

24

? ?

说明: 在不考虑1-f 的情况下,估计量的方差与 样本容量n成反比;

?

当其他条件不变时,估计量的方差与总
体未入样率(1-f)成正比。

?

样本均值的方差与总体方差成正比。

25

三、估计量的方差估计
n 1 2 2 s ? ? ? yi ? y ? n ? 1 i ?1

1 ? 2 2? ? ? ? yi ? ny ? n ? 1 ? i ?1 ?
n

1? f 2 V ?y? ? S n
用s2代替S2

1? f 2 v? y ? ? s n

26

四、总体均值估计的置信区间
1-a 称为置信水平或置信度,在1-a 的置信度下, 总体均值 Y ,落在近似置信区间:

? 1-f 1-f ? ? s , y ? zα ? s? ? y ? zα 2 2 n n ? ?
置信度与置信区间共同反映抽样调查的信度, 其含义是总体均值落在上述置信区间的概率 不低于1-a 。

27

置信度1-a 与概率度 z ,两者是一一对应的正比例关系。
α 2

两者常用的数值主要有(可查正态分布概率表):
令 zα ? t
2

1-a =68.27% 1-a =95% 1-a =95.45%

t=1 t=1.96 t=2

1-a =99.73%

t=3

28

五、总体均值估计的步骤
1)计算样本均值 2)计算样本方差
y

s2
1? f 2 v? y ? ? s n

3)计算样本均值的方差 4)给定置信度1-a

? 1-f 1-f ? ? s , y ? zα ? s? 5)计算置信区间 ? y ? z α 2 2 n n ? ?

?y ? t

V ( y) , y ? t V ( y)

?

29

【例2.3】
?

某学院有100名学生,我们从中随机抽出10名学生调 查他们每天学习英语的时间(小时),调查资料如 下表,根据对这10名学生的调查结果,在95%的置信 度下估计全学院学生每天学习英语的平均时间。
序号
i

1

2

3

4

5

6

7

8

9

10

yi

4

5

2

0

4

6

6

15

0

8

30

解:
1 n 50 y ? ? yi ? ? 5(小时) n i ?1 10

1 n 172 s ? ( yi ? y ) 2 ? ? 19.11 ? n ? 1 i ?1 9
2

? ? y ?5 Y
1 ? f 2 1 ? 0.1 v? y ? ? s ? ? 19.11 ? 1.72 n 10

v( y) ? 1.31(小时)
31

当置信度为95%时,对应的概率度 z α ? t ? 1.96 2 因此,可以以95%的概率保证程度估计全学

院100名学生平均每天学习英语的时间:

?y ? t

V ( y) , y ? t V ( y)

?

5 ? 1.96? 1.31 ? 5 ? 2.57 ? [2.43,7.57]
即:以95%的概率保证程度,估计全学院100名

学生平均每天学习英语的时间在2.43~7.57小时之间。

32

思考题
?

为调查某地区1960个村新棉收购情况,以

简单不重复抽样方式随机抽取49个村进行
调查,求得样本均值为7000公斤,样本方 差为180公斤。试以99.73%的可靠程度估 计该地区平均每村收购棉花多少公斤?

33

y ? 7000 斤 ) s 2 ? 180 (公 已知:
49 1? 1? f 2 解:v ? y ? ? 1960 ? 180 ? 3.5816 s ? n 49

v( y) ? 1.89
当置信度为99.73%时,对应的概率度 z α ? t ? 3 2

t v( p) ? 3 ?1.89 ? 5.67 公 ) ( 斤
7000? 5.67 ? [699433,700567] . .
以99.73%的可靠程度估计该地区平均每村收购 棉花在6994.33~7005.67公斤之间。

34

2.2.2 对总体比例的估计
一、对总体的描述
总体按所研 究标志不同

变量总体(研究数量标志)
属性总体(研究品质标志)

在属性总体中,当所研究的标志,其表现只有两种属 性,即“是”或“非”时,将该属性总体称为是非标志总 例如: 体。 产品按质量分组 合格品 (是) 注意:

学生按成绩分组

“是”与 不合格品 (非) “非”是根 据研究目的 及格 (非) 确定的,研 究的标志是 不及格 (是) “是”。

35

1、成数
在是非标志总体中,设总体有N个单位,其中,有 A个单位具有某种性质或属性(“是”的属性),有B 个单位不具有某种性质或属性(“非”的属性),而 A+B=N 则有:
成数

P?

A N B N

即总体中具有研究标志的单位数 在总体中所占的比重 即总体中不具有研究标志的单位 数在总体中所占的比重

成数 Q ?

?P ? Q ? 1

Q ?1 ? P
36

2、总体比例(是非标志的均值)
由于是非标志的表现不能用数值表示,为了研究

问题方便,我们可以将是非标志数量化。
即用1表示单位标志为“是”的标志值(即具有 研究标志的单位的标志值);用0表示单位标志为 “非”的标志值(即不具有研究标志的单位的标志 值)。
产 品 标志值 Yi 1 单位数 Ni

合格(是)

不合格(非)
合 计

0


A B

N

37

? YN i 1? A ? 0 ? B A Y ? ? ? ?P Ni ? A? B N

总体比例的方差:

A 所以,总体比例为:P ? N
2

Sp

1 N N 2 ? ? (Yi ? Y ) ? N ? 1 PQ N ? 1 i ?1

38

二、估计量及其性质
样本比例:

a p? n

样本比例的方差:

n s ? p(1 ? p) n ?1
2 p

估计量p的方差: (所有可能的样本比例与总体比例的误差的方差)

1? f 2 1? f n ? sp ? ? p?1 ? p ? ? V ( p) ? n n n ?1 1? f ? ? p?1 ? p ? n ?1
39

三、总体比例估计的置信区间
在1-a 的置信度下,总体比例P落在近似置信区间:

? ? 1? f 1? f p?1 ? p ? , p ? z α p?1 ? p ? ? ? p ? zα 2 2 n ?1 n ?1 ? ?

?p ? t

? ? V ( p) , p ? t V ( p)

?

40

四、总体比例估计的步骤
a 1)计算样本比例 p ? n

1? f ? ? p?1 ? p ? 2)计算样本均值的方差 V ( p)? n ?1
3)给定置信度1-a 4)计算置信区间

?p ? z

α 2

? ? V ( p) , p ? z α V ( p)
2

?
41

例, 某高校有10000名在校生,现随机从中抽取 400名,结果有320名学生近视,在置信水平95.45%的 条件下,试估计该高校全体在校生近视率的置信区间。

已 : N ? 10000 知 a ? 320
解:

n ? 400

1 - ? ? 95.45%

a 320 p? ? ? 80% n 400

42

1? f ? p?1 ? p ? V ( p) ? n ?1
400 1? 10000 ? 0.8 ? 0.2 ? 0 .000385 ? 400 ? 1

V ? p? ? 0.000385? 0.0196? 1.96%
置信水平95.45%时,概率度

z ?t ?2
α 2

43

该高校全体在校生近视率的置信区间为:

?p ? z

α 2

? ? V ( p) , p ? z α V ( p)
2

?

?80%? 2 ? 1.96% ? ?80% ? 3.92%? ?
P {76.08%≤P ≤83.92%}=95.45%
即:以95.45%的概率保证程度估计该校在校学生

近视率在76.08%~83.92%之间。

44

【例2.5】
?

某超市新开张一段时间之后,为改进销售服务环 境,欲调查附近几个小区居民到该超市购物的满 意度,该超市与附近几个小区的居委会取得联系, 在总体中按简单随机抽样抽取了一个大小为=200 人的样本,调查发现对该超市购物环境表示满意 或基本满意的居民有130位,要估计对该超市购物 环境持肯定态度居民的比例,并在置信度95%下, 给出估计的置信区间。假定这时的抽样比可以忽 略。

45

a 130 p? ? ? 65% n 200
1? f 1 v? p? ? pq ? ? 0.65 ? 0.35 ? 0.001143 n ?1 200 ? 1

v? p? ? 0.0338? 3.38%
t v( p) ? 1.96? 3.38% ? 6.62%
65% ? 6.62% =[58.38%,71.62%]
在95%的置信度下,对该超市购物环境持肯定态度 居民的比例在 58.38%~71.62% 之间。
46

思考题
?

例:从5620个中学中抽出一个含有300个 学校的简单随机样本,其中有187个学校 赞成一项提案,试以95%的置信度估计赞 成该提案的比例及总的学校数。

47

2.2.3 对总体总量的简单估计
?

总体总量的简单估计:
??N y? N Y n

?y
i ?1

n

i

?

总量的方差估计:

N ?N ? n ? 2 2 ?1? f V ?Y ? ? V ? Ny ? ? S ? N ?? n ? n
N ?N ? n ? 2 2 ?1? f v ? Ny ? ? s ? N ?? n ? n

? 2 ?? S ?

? 2 ?? s ?

48

?

总量估计的置信区间:

?Ny ? z
?

α 2

v ? Ny ? , Ny ? z α v ? Ny ?
2

?

或者表达为:
? 1-f 1-f ? N ? ? y ? zα ? s , y ? zα ? s? 2 2 n n ? ?

?

这两个区间是等价的

49

例:p63习题2.6
某地区350个乡为了获得粮食总产量的估计,调 查了50个乡当年的粮食产量,得到

y ? 1120 吨 , S 2 ? 25600 ( )
据此估计今年的粮食总产量,并给出置信水平95%的 置信区间。

解:

50 1? 1? f 2 350 ? 25600? 438.86 v? y ? ? s ? n 50

v( y) ? 20.95
50

当置信度为95%时,对应的概率度 z α ? t ? 1.96 2

因此,可以以95%的概率保证程度估计350个乡的平 均粮食产量为:

1120? 1.96? 20.95 ? 1120? 41 ? [1079, 1161吨 ]
则以95%的概率保证程度,估计350个乡的粮食总

产量为:

350? [1079, 1161 ]

即在377650吨至406350吨之间。

51


相关文章:
抽样调查 课件
抽样调查 课件 隐藏>> 绪论 一.抽样调查的概念 抽样调查是一种非全面调查,它...它是抽样调查中最简单组织形式。 2.系统随机抽样 系统随机抽样又称为机械随机...
2 统计调查课件内容
10.1 抽样调查 课件2-- 24页 免费 统计调查课件 23页 免费 10.1 统计调查(1)课件 15页 免费如要投诉违规内容,请到百度文库投诉中心;如要提出功能问题或意见...
统计学课件 第六章 抽样调查
、样本方差s 2 2 准差:总体标准差?、样本标准差s第抽样调查的组织形式 通常有以下四种组织形式: 一、 简单随机抽样(纯随机抽样) 即从总体单位中不加...
社会调查课件(精简版)
46页 1下载券 社会调查与分析课件(2) 91页 1下载券喜欢此文档的还喜欢 体育...非全面调查:典型调查重点调查抽样调查个案调查 8. 横向研究:指的是收集一个时间...
统计调查课件
统计调查课件_数学_初中教育_教育专区。七年级数学教学预案 第 12 周第 1 ...了解抽样调查、样本、个体与总体等统计概 念;2、初步感受抽样调查的必要性,初步...
统计调查课件
统计调查课件_数学_初中教育_教育专区。七年级数学教学预案 第 12 周第 1 ...了解抽样调查、样本、个体与总体等统计概 念;2、初步感受抽样调查的必要性,初步...
统计调查课件
统计调查课件_数学_初中教育_教育专区。七年级数学教学预案 第 12 周第 1 ...了解抽样调查、样本、个体与总体等统计概 念;2、初步感受抽样调查的必要性,初步...
统计调查课件
统计调查课件_小学作文_小学教育_教育专区。七年级数学教学预案 第 12 周第 1...了解抽样调查、样本、个体与总体等统计概 念;2、初步感受抽样调查的必要性,初步...
抽样调查终稿
抽样调查课件讲稿2 66页 1下载券 普查与抽样调查 教学设计... 暂无评价 4页...抽样调查报告 系 别统计系(1001) 学生姓名黄斌(1102100133) 李冲(1102100136) ...
10.1.2统计调查(2)
[课件展示] 1、课件展示问题 3. (2)如果是抽样调查,指出调查的总体,个体,样本和样本容量 ? 总体是 ? 个体是 ? 样本是 ? 样本的容量是 (3) 这个调查结果...
更多相关标签:
抽样调查课件 | 普查和抽样调查课件 | 抽样调查课件ppt | 普查与抽样调查课件 | 6.2普查与抽样调查 | 抽样调查 | 抽样调查的适用条件 | 人口抽样调查工作总结 |