当前位置:首页 >> 数学 >>

【多彩课堂】2015-2016学年高中数学人教A版选修1-2课件:1.2《独立性检验的基本思想及初步应用》


3.1 独立性检验的 基本思想及初步应用

1.(1)了解独立性检验的基本思想、方法及初步应用. (2) 会从列联表 ( 只要求 2×2 列联表 ) 、等高条形图直观分析 两个分类变量是否有关.

(3) 会用 K2 公式判断两个分类变量在某种可信程度上的相关
性. 2 .运用数形结合的方法,借助对典型案例的探究,来了解 独立性

检验的基本思想,总结独立性检验的基本步骤. 3.(1) 通过本节课的学习,让学生感受数学与现实生活的联 系,体会独立性检验的基本思想在解决日常生活问题中的作用. (2) 培养学生运用所学知识,依据独立性检验的思想作出合

理推断的实事求是的好习惯.

本课主要学习独立性检验的基本思想及初步应用 。

以吸烟是否对肺癌有影响引入新课,通过数据和图表分
析,得到结论是:吸烟与患肺癌有关初步判断两分类变

量具有相关性。
通过结论的可靠程度如何?引出如何通过量化来进

行研究判断两分类变量是否具有相关性,相关程度有多
大?通过假设两分类变量没有相关性,也就是是相互独

立的,得到判断两分类变量相关性检验方法。再通过例1

例2讲解引导学生掌握独立性检验的基本思想及初步应用。

列联表 为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机 地调查了9965人,得到如下结果(单位:人)
吸烟与肺癌列联表 不患肺癌 不吸烟 7775 患肺癌 42 总计 7817

吸烟
总计

2099
9874

49
91

2148
9965

在不吸烟者中患肺癌的比重是 0.54% 2.28% 在吸烟者中患肺癌的比重是 说明:吸烟者和不吸烟者患肺癌的可能性存在差异, 吸烟者患肺癌的可能性大

1) 通过图形直观判断两个分类变量是否相关: 三维柱 状图

8000 7000 6000 5000 4000 3000 2000 1000 0 不患肺癌 患肺癌

不吸烟 吸烟 吸烟 不吸烟

2) 通过图形直观判断两个分类变量是否相关:
9000 8000 7000 6000 5000 4000 3000 2000 1000 0 不吸烟 吸烟 患肺癌 不患肺癌

二维条 形图

3)通过图形直观判断两个分类变量是否相关: 等高条 形图
100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% 不吸烟 吸烟

患肺癌 比例
患肺癌 不患肺癌

不患肺癌 比例

独立性检验 H0: 吸烟和患肺癌之间没有关系 ←→ H1: 吸烟和患肺癌之间有关系 结论的可靠 程度如何? 用 A 表示“不吸烟”, B 表示“不患肺癌” 则 H0: 吸烟和患肺癌之间没有关系 即A与B独立 等价于 “吸烟”与“患肺癌”独立, 等价于

通过数据和图表分析,得到 结论是:吸烟与患肺癌有关

P(AB)= P(A)P(B)
吸烟与肺癌列联表
不患肺癌 患肺癌 b 总计 a+b a

不吸烟

吸烟
总计

c
a+c

d
b+d

c+d
a+b+c+d

a+b a+c a P(A)= ,P(B)= ,P(AB)= n n n 其中n = a + b + c + d

a a+b a+c ? ≈ × n n n

?

?a + b+c+d ? a ? ?a + b?(a +c),

ad ? bc

独立性检验

ad ? bc ? 0.

ad - bc 越小,说明吸烟与患肺癌之间的关系越弱, ad - bc 越大,说明吸烟与患肺癌之间的关系越强
引入一个随机变量
2 n(ad bc) K2 = (a + b)(c + d)(a + c)(b + d)

作为检验在多大程度上可以认为“两个变量有关系” 的标准 。

设有两个分类变量X和Y它们的值域分别为{x1,x2}和 {y1,y2}其样本频数列表(称为2×2列联表)为
2×2列联表 2 ( n ad ? bc ) K2 ? (a ? b)(c ? d )(a ? c)(b ? d )
P(k ≥ m)
2

y1 x1
a

y2
b

总计 a+b

x2
总计

c
a+c

d
b+d

c+d
a+b+c+d

1)如果P(m>10.828)= 0.001表示有99.9%的把握认为”X与Y”有关系;

适用观测数据 a、 2)如果P(m>7.879)= 0.005表示有99.5%的把握认为” X与Y”有关系 ; b、
3)如果P(m>6.635)= 0.01表示有99%的把握认为”X与Y”有关系; 4)如果P(m>5.024)= 0.025表示有97.5%的把握认为”X与Y”有关系; 5)如果P(m>3.841)= 0.05表示有95%的把握认为”X与Y”有关系; 6)如果P(m>2.706)= 0.010表示有90%的把握认为”X与Y”有关系;

c、d不小于5

7)如果m≤2.706),就认为没有充分的证据显示”X与Y”有关系;

P(χ≥x0) x0

0.50

0.40

0.25 0.15

0.10

0.05 0.025 0.010 0.005 0.001

0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828

例如
K ? 10.828
2

0.1%把握认 为A与B无关
1%把握认为A 与B无关

99.9%把握认 为A与B有关 99%把握认 为A与B有关 90%把握认 为A与B有关

K ? 6.635
2

K ? 2.706
2

10%把握认为 A与B无关

K ? 2.706
2

没有充分的依据显示A与B有关, 但也不能显示A与B无关

独立性检验

不吸烟 吸烟 总计

吸烟与肺癌列联表 不患肺癌 患肺癌 7775 42 2099 49 9874 91

总计 7817 2148 9965

通过公式计算

9965(7775 ? 49 ? 42 ? 2099) K ? ? 56.632 7817 ? 2148 ? 9874 ? 91
2 2

独立性检验
已知在 H 0 成立的情况下,

P( K ? 6.635) ? 0.01
2

即在 H 0成立的情况下,K2 大于6.635概率非常小,近 似为0.01 现在的K2=56.632的观测值远大于6.635 所以有理由断定H0不成立,即认为”吸烟与患肺 癌有关系”

例1.在某医院,因为患心脏病而住院的 665名男性病人 中,有214人秃顶,而另外772名不是因为患心脏病而住 院的男性病人中有175人秃顶.分别利用图形和独立性 检验方法判断是否有关 ? 你所得的结论在什么范围内 有效?

解 根据题目所给数据得到 如下列联表
表3 ? 11 秃顶与患心脏病列联表

秃顶 不秃顶 总计

患心脏病 214 451 665

患其他病 175 597 772

总计 389 1048 1437

1437 ? ?214 ? 597 ? 175 ? 451? K ? ? 16.373 ? 6.635. 389 ? 1048 ? 665 ? 772 所以有99%的把握认为 " 秃顶与患心脏病有关 ". 因为这组数据来自住院 的病人,因此所得到的结论适合 住院的病人群体 .
2 2

相应的三 维柱形图 600 如图 3.2 ? 4 所示.比 500 400 较来说 , 底面副对角 300 200 线上两个柱 体 高度 100 0 的乘积要大一些 ,可 秃顶 不秃顶 以在 某种程度上认 图3.2 ? 4 为" 秃顶与患心脏病有关 ". 根据列联表 3 ? 11 中的数据 , 得到

患其他病
患心脏病

例2.为考察高中生性别与是否喜欢数学课程之间的关系, 在某城市的某校高中生中随机抽取300名学生,得到如下 列联表: 性别与喜欢数学课程列联表
喜欢数学课程 男 女 总计 37 35 72 不喜欢数学课程 总计 122 178 300 85 143 228

a c

b d

由表中数据计算得 K 2 ≈4.513, 高中生的性别与是否喜 欢数学课程之间是否有关系?为什么?

解 可以有约 95%以上把握认为 " 性别与喜欢数学 课之间有关系 ". 作出这种判断的依 据是独立性检 验的基本思想 , 具体过程如下 : 分别用 a, b, c, d表示样本中喜欢数学课 的男生人数、 不喜欢数学课的男生人 数、喜欢 数学课的女生人 数、不喜欢数学课的女 生人数 .如果性别与是否喜 欢 数 学 课 有关 系 , 则男 生中喜 欢 数 学 课 的比 例 a c 与女生中喜欢 数学课的人数比例 应该 a?b c?d a c ac ? bd 相差很多, 即 ? ? 应很大. a ? b c ? d ?a ? b ??c ? d?

将上式等号右边的式子 乘以常数因子

?a ? b ? c ? d??a ? b??c ? d? , ?a ? c ??b ? d?
然后平方得 K ?
2

? a ? b ?? c ? d ?? a ? c ?? b ? d ?

n ? ad ? bc ?

2

,

其中 n ? a ? b ? c ? d.因此 K 2越大, " 性别与喜 欢数学课之间有关系 " 成立的可能性越大 .

另一方面 , 假设 " 性别与喜欢数学课之间 没有关系 " , 由于事件 A ? ?K 2 ? 3.841?的概率为 P?K 2 ? 3.841? ? 0.05,因此事件 A是一个小概率事件 .而由样本数 据计算得 K 2 ? 4.513, 这表明小概率事件 A发生.根 据假设检验的基本原理 , 我们应该断定 " 性别与喜 欢数学课之间有关系 " 成立, 并且这种判断出错的 可能性约为 5%.所以, 约有95%的把握认为 " 性别与 喜欢数学课之间有关系 ".

独立性检验基本的思想类似反证法 (1)假设结论不成立,即“两个分类变量没有关系”.

(2)在此假设下随机变量 K2 应该很能小,如果由观 测数据
计算得到K2的观测值k很大,则在一定程度上说明假 设不合理. (3)根据随机变量K2的含义,可以通过评价该假设不 合理的程度,由实际计算出的,说明假设合理的程 度为99.9%,即“两个分类变量有关系”这一结论 成立的可信度为约为99.9%.

敬请指导
.


相关文章:
2015-2016高中数学 1.2独立性检验的基本思想及其初步应用练习 新人教A版选修1-2
2015-2016高中数学 1.2独立性检验的基本思想及其初步应用练习 新人教A版选修1-2_数学_高中教育_教育专区。1 .2 基础梳理 独立性检验的基本思想及其初步应用 1....
数学选修.1-2罗桑旦增
数学选修.1-2罗桑旦增_高一数学_数学_高中教育_教育专区。高中数学选修1-2...4 1.2 独立性检验的基本思想及其初步应用一、最新考纲:了解独立性检验(只要求...
【创新设计】2015-2016学年高中数学 第一章 统计案例 1.2独立性检验的基本思想及其初步应用课时作业
【创新设计】2015-2016学年高中数学 第一章 统计案例 1.2独立性检验的基本...人教 A 版选修 1-2 明目标、知重点 1.了解分类变量的意义.2.了解 2×2 ...
高中数学选修1-1、1-2目录
高中数学选修1-1、1-2目录_数学_高中教育_教育专区。课本目录,以备复习用 选修1-2 第一章 统计案例 1.1 回归分析的基本思想及其应用 1.2 独立性检验的基本...
高中数学选修1-2目录
高中数学选修 1-2 第一章 1.1 1.2 统计案例 回归分析的基本思想及其初步应用 独立性检验的基本思想及其初步应用 实习作业 小结 复习参考题 第二章 2.1 推理...
2015-2016学年高中数学 3.2独立性检验的基本思想及其初步应用课时作业 新人教A版选修2-3
2015-2016学年高中数学 3.2独立性检验的基本思想及其初步应用课时作业 新人教A版选修2-3_数学_高中教育_教育专区。2015-2016 学年高中数学 3.2 独立性检验的...
2015-2016学年高中政治 1.2.1《哲学的基本问题》课时作业 新人教版必修4
2015-2016学年高中政治 1.2.1《哲学的基本问题》课时作业 新人教版必修4_政...A、C 不 属于哲学的基本问题,B 与题意不符,排除。 【答案】 D 2.哲学史...
人教版高二数学选修1-2参考资料(学案)
人教版高二数学选修1-2参考资料(学案)_数学_高中教育...1.2 独立性检验的基本思想及其初步应用 本节题目:...举一反三: 【变式 1】用推理的形式表示等差数列 ...
【成才之路】2015-2016学年高中数学 3.2独立性检验的基本思想及其初步应用课时作业 新人教A版选修2-3
【成才之路】2015-2016学年高中数学 3.2独立性检验的基本思想及其初步应用课时作业 新人教A版选修2-3_数学_高中教育_教育专区。【成才之路】 2015-2016 学年...
1.2 独立性检验的基本思想及其初步应用 学案(人教A版选修1-2) (1)
(人教A版选修1-2) (1)_高二数学_数学_高中教育...1.2 独立性检验的基本思想及其初步应用 课标解读 1...(难点) 分类变量与列联表 【问题导思】 吸烟变量...
更多相关标签:

相关文章