当前位置:首页 >> 高考 >>

(通用)2018年高考数学一轮复习第十章统计与统计案例103变量间的相关关系、统计案例学案理!


§10.3
考纲展示?

变量间的相关关系、统计案例

1.会作两个相关变量的散点图,会利用散点图认识变量之间的相关关系. 2.了解最小二乘法的思想,能根据给出的线性回归系数公式建立线性回归方程. 3.了解独立性检验(只要求 2×2 列联表)的基本思想、方法及其简单应用. 4.了解回归分析的基本思想、方法及其简单应用. 考点 1 变量间的相关关系

1.常见的两变量之间的关系有两类:一类是函数关系,另一类是 ________;与函数关系 不同,________是一种非确定性关系. 答案:相关关系 相关关系 2.从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为 ________,点散布在左上角到右下角的区域内,两个变量的相关关系为________. 答案:正相关 负相关

对回归系数的理解:解释变量;预报变量. ^ 某工厂工人月工资 y(元)依劳动产值 x(万元)变化的回归直线方程为y=900x+600,下列 判断正确的是__________. ①劳动产值为 10 000 元时,工资为 500 元; ②劳动产值提高 10 000 元时,工资提高 1 500 元; ③劳动产值提高 10 000 元时,工资提高 900 元; ④劳动产值为 10 000 元时,工资为 900 元. 答案:③ ^ 解析:回归系数b的意义为:解释变量每增加 1 个单位,预报变量平均增加 b 个单位.

[典题 1] (1)下列四个散点图中,变量 x 与 y 之间具有负的线性相关关系的是(

)

-1-

A

B

C [答案] D

D

[解析] 观察散点图可知,只有 D 选项的散点图表示的是变量 x 与 y 之间具有负的线性 相关关系. (2)四名同学根据各自的样本数据研究变量 x,y 之间的相关关系,并求得回归直线方程, 分别得到以下四个结论: ^ ①y 与 x 负相关且y=2.347x-6.423; ^ ②y 与 x 负相关且y=-3.476x+5.648; ^ ③y 与 x 正相关且y=5.437x+8.493; ^ ④y 与 x 正相关且y=-4.326x-4.578. 其中一定不正确的结论的序号是( A.①② B.②③ C.③④ D.①④ [答案] D ^ ^ ^ ^ ^ [解析] 由回归方程y=bx+a知,当b>0 时,y 与 x 正相关,当b<0 时,y 与 x 负相关, ∴①④一定错误. [点石成金] 相关关系的直观判断方法就是作出散点图,若散点图呈带状且区域较窄, )

说明两个变量有一定的线性相关性,若呈曲线型也是有相关性,若呈图形区域且分布较乱则 不具备相关性. 考点 2 线性回归分析

-2-

1.回归分析 对具有________的两个变量进行统计分析的方法叫回归分析.其基本步骤是: (ⅰ)画散 点图;(ⅱ)求________;(ⅲ)用回归直线方程作预报. 答案:相关关系 回归直线方程 2.回归直线 如果散点图中点的分布从整体上看大致在 ________附近,就称这两个变量之间具有线性 相关关系,这条直线叫做回归直线. 答案:一条直线 3.回归直线方程的求法——最小二乘法 设具有线性相关关系的两个变量 x,y 的一组观察值为(xi,yi)(i=1,2,?,n),则回归

? ? ?x - x ??y - y ? ^ ? b= = ^ ^ ^ 直线方程y=bx+a的系数为:? ? ?x - x ? ?^ ^ ?a= y -b x ,
n i i i=1 n
2

, 其中

i

i=1

x = ?xi,y= ?yi,( x , y )称为样本点的________. ni=1 ni=1

1

n

1

n

?xiyi-n x y
i=1

n

答案:

中心

x2 i-n ?x2
i=1

n

4.相关系数 当 r>0 时,表明两个变量________; 当 r<0 时,表明两个变量________.

r 的绝对值越接近于 1,表明两个变量的线性相关性________. r 的绝对值越接近于 0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于 0.75
时,认为两个变量有很强的线性相关性. 答案:正相关 负相关 越强

-3-

[教材习题改编]已知回归直线的斜率的估计值为 1.23,样本点的中心为(4,5),则回归直 线方程为__________. ^ 答案:y=1.23x+0.08 ^ ^ 解析:设回归直线方程为y=1.23x+a, 因为回归直线必过样本点的中心(x,y), ^ 将点(4,5)代入回归直线方程得a=0.08, ^ 所以所求方程为y=1.23x+0.08.

变量的相关关系:散点图;回归直线过( x , y ). 某工厂经过技术改造后,生产某种产品的产量 x(吨)与相应的生产能耗 y(吨标准煤)有如 下几组样本数据.

x y

3 2.5

4 3

5 4

6 4.5

据相关性检验,y 与 x 具有线性相关关系,通过线性回归分析,求得回归直线的斜率为 0.7,那么当产量 x=10 吨时,估计相应的生产能耗为__________吨标准煤. 答案:7.35 ^ ^ ^ 解析:先求得 x =4.5, y =3.5,由y=0.7x+a过点( x , y ),得a=0.35, ^ 所以回归直线方程是y=0.7x+0.35. ^ 当 x=10 吨时,y=7+0.35=7.35(吨标准煤).

[典题 2] (1)已知 x,y 的取值如下表,从散点图可以看出 y 与 x 线性相关,且回归方程 ^ ^ ^ 为y=0.95x+a,则a=( )

x y
A.3.25 C.2.2

0 2.2

1 4.3

3 4.8 B.2.6 D.0

4 6.7

-4-

[答案] B [解析] 由已知得 x =2, y =4.5, 因为回归方程经过点( x , y ), ^ 所以a=4.5-0.95×2=2.6. (2)由某种设备的使用年限 xi(年)与所支出的维修费 yi(万元)的数据资料算得如下结果,
i=90, ?xiyi=112, ?xi=20, ?yi=25. ?x2 i=1 i=1 i=1 i=1
5 5 5 5

^ ^ ^ ①求所支出的维修费 y 对使用年限 x 的线性回归方程y=bx+a; ②(ⅰ)判断变量 x 与 y 之间是正相关还是负相关; (ⅱ)当使用年限为 8 年时,试估计支出的维修费是多少.

?xiyi-n x y
^ ^ ^ ^ 附:在线性回归方程y=bx+a中,b=
i=1

n

^ ^ ,a= y -b x ,其中 x , y 为样
i- n x ?x2 i=1 n
2

本平均值. [解] ①∵ ?xi=20, ?yi=25,
i=1 i=1
5 5

15 15 ∴ x = ?xi=4, y = ?yi=5, 5i=1 5i=1
5

?xiyi-5 x y
^ ∴b=
i=1


i-5 x ?x2 i=1
5 2

112-5×4×5 =1.2, 2 90-5×4

^

a= y -b x =5-1.2×4=0.2.
^ ∴线性回归方程为y=1.2x+0.2. ^ ②(ⅰ)由①知,b=1.2>0, ∴变量 x 与 y 之间是正相关. ^ (ⅱ)由①知,当 x=8 时,y=9.8,即使用年限为 8 年时,支出维修费约是 9.8 万元. ^ ^ [点石成金] 1.正确理解计算b,a的公式和准确的计算是求线性回归方程的关键.
-5-

^

^ ^ ^ 2.回归直线方程y=bx+a必过样本点的中心( x , y ). 3.在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否 具有相关关系,若具有线性相关关系,则可通过线性回归方程来估计和预测.

某地最近十年粮食需求量逐年上升,下表是部分统计数据: 年份 需求量(万吨) 2006 236 2008 246 2010 257 2012 276 2014 286

^ ^ ^ (1)利用所给数据求年需求量与年份之间的回归直线方程y=bx+a; (2)利用(1)中所求出的回归直线方程预测该地 2016 年的粮食需求量. 解:(1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来配回归直线方程, 为此对数据预处理如下: 年份-2 010 需求量-257 -4 -21 -2 -11 0 0 2 19 4 29

对预处理后的数据,容易算得,

x =0, y =3.2,
^

b=


?-4?×?-21?+?-2?×?-11?+2×19+4×29-5×0×3.2 2 2 2 2 2 ?-4? +?-2? +2 +4 -5×0

260 ^ ^ =6.5,a= y -b x =3.2. 40

由上述计算结果知,所求回归直线方程为 ^

y-257=b(x-2 010)+a
=6.5(x-2 010)+3.2, ^ 即y=6.5×(x-2 010)+260.2. (2)利用(1)中所求回归直线方程,可预测 2016 年的粮食需求量为 6.5×(2 016-2 010) +260.2=6.5×6+260.2=299.2(万吨). 考点 3 独立性检验

^

^

1.分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.
-6-

2.列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变量 X 和 Y,它 们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为 2×2 列联表)为 2×2 列联表:

y1 x1 x2
总计

y2 b d b+d

总计

a c a+c

a+b c+d a+b+c+d

K2=

n?ad-bc?2 (其中 n=________为样本容量),则利用独立性 ?a+b??a+c??b+d??c+d?

检验判断表来判断“X 与 Y 的关系”. 答案:a+b+c+d

(1)[教材习题改编]为调查中学生的近视情况,测得某校 150 名男生中有 80 名近视,140 名女生中有 70 名近视.在检验这些学生眼睛近视是否与性别有关时,最有说服力的方法是 ________.(填序号) ①回归分析;②期望与方差;③独立性检验;④概率. 答案:③ 解析:“近视”与“性别”是两个分类变量,其是否有关,应该用独立性检验来判断. (2)[教材习题改编]在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得出 “吸烟与患肺癌有关”的结论,并且有 99%以上的把握认为这个结论是成立的,有下列四种说 法: ①100 个吸烟者中至少有 99 人患有肺癌; ②1 个人吸烟, 那么这人有 99%的概率患有肺癌; ③在 100 个吸烟者中一定有患肺癌的人; ④在 100 个吸烟者中可能一个患肺癌的人也没有. 其 中正确说法的序号是________. 答案:④

对独立性检验的理解:K 的计算;对 P(K ≥k0)的解释. [2017·湖南张家界模拟]某高校教“统计初步”课程的教师随机调查了选该课程的一些 学生的情况,具体数据如下表: 专业 性别 男 非统计专业 13 统计专业 10
-7-

2

2



7

20
2

为了判断主修统计专业是否与性别有关系,根据表中的数据,得到 K 的观测值 k = 50×?13×20-10×7? ≈4.844. 23×27×20×30 因为 k>3.841 ,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为 ________. 附表:
2

P(K2≥k0) k0
答案:5%

0.050 3.841

0.010 6.635

0.001 10.828

解析: ∵k>3.841,查临界值表, 得 P(K ≥3.841)=0.05,故这种判断出错的可能性为 5%.

2

[典题 3] (1)为了判断高中三年级学生选修文理科是否与性别有关, 现随机抽取 50 名学 生,得到 2×2 列联表: 理科 男 女 总计 已知 P(K ≥3.841)≈0.05,
2

文科 10 20 30

总计 23 27 50

13 7 20

P(K2≥5.024)≈0.025.
50×?13×20-10×7? 2 根据表中数据,得到 K = ≈4.844,则认为选修文理科与性别有 23×27×20×30 关系出错的可能性约为________. [答案] 5% [解析] 由 K ≈4.844>3.841.故认为选修文理科与性别有关系出错的可能性约为 5%. (2)[2017·江西九江模拟]某校数学课外兴趣小组为研究数学成绩是否与性别有关,先统 计本校高三年级每个学生一学期数学成绩平均分(采用百分制),剔除平均分在 40 分以下的学 生后,共有男生 300 名,女生 200 名.现采用分层抽样的方法,从中抽取了 100 名学生,按 性别分为两组,并将两组学生的成绩分为 6 组,得到如下所示的频数分布表. 分数段 男 [40, 50) 3 [50, 60) 9 [60, 70) 18 [70, 80) 15 [80, 90) 6 [90, 100] 9
2 2

-8-



6

4

5

10

13

2

①估计男、女生各自的平均分(同一组数据用该组区间中点值作代表),从计算结果看, 数学成绩与性别是否有关; ②规定 80 分以上为优分(含 80 分),请你根据已知条件作出 2×2 列联表,并判断是否有 90%以上的把握认为“数学成绩与性别有关”. 优分 男生 女生 总计 附表及公式: 100 非优分 总计

P(K2≥k0) k0 K2=

0.100 2.706

0.050 3.841

0.010 6.635

0.001 10.828

n?ad-bc?2 . ?a+b??c+d??a+c??b+d?

[解] ① x 男=45×0.05+55×0.15+65×0.3+75×0.25+85×0.1+95×0.15=71.5,

x 女=45×0.15+55×0.1+65×0.125+75×0.25+85×0.325+95×0.05=71.5,
从男、女生各自的平均分来看,并不能判断数学成绩与性别有关. ②由频数分布表可知, 在抽取的 100 名学生中, “男生组”中的优分有 15 人, “女生组” 中的优分有 15 人, 据此可得 2×2 列联表如下: 优分 男生 女生 总计 15 15 30
2

非优分 45 25 70

总计 60 40 100

100×?15×25-15×45? 2 可得 K = ≈1.79, 60×40×30×70 因为 1.79<2.706,所以没有 90%以上的把握认为“数学成绩与性别有关”. [点石成金] 1.独立性检验的关键是正确列出 2×2 列联表,并计算出 K 的值. 2.弄清判断两变量有关的把握性与犯错误概率的关系,根据题目要求作出正确的回答.
2

[2017·广西玉林、贵港联考]某市地铁即将于 2015 年 6 月开始运营,为此召开了一个价
-9-

格听证会,拟定价格后又进行了一次调查,随机抽查了 50 人,他们的收入与态度如下; 月收入 (单位: 百元) 赞成定 价者人数 认为价 格偏高 者人数 (1)若以区间的中点值为该区间内的人均月收入,求参与调查的人员中“赞成定价者”与 “认为价格偏高者”的月平均收入的差距是多少(结果保留 2 位小数); (2)由以上统计数据填写下面的 2×2 列联表分析是否有 99%的把握认为“月收入以 55 百 元为分界点对地铁定价的态度有差异”. 月收入低于 55 百元的人数 认为价 格偏高者 赞成 定价者 总计 月收入不低于 55 百元的人数 总计 4 8 12 5 2 1 [15, 25) [25, 35) [35, 45) [45, 55) [55, 65) [65, 75]

1

2

3

5

3

4

n?ad-bc? 2 附:K = . ?a+b??c+d??a+c??b+d? P(K2≥k0) k0
解:(1)“赞成定价者”的月平均收入为 0.05 3.841 0.01 6.635

2

x 1=

20×1+30×2+40×3+50×5+60×3+70×4 1+2+3+5+3+4

≈50.56. “认为价格偏高者”的月平均收入为

x 2=

20×4+30×8+40×12+50×5+60×2+70×1 4+8+12+5+2+1

=38.75, ∴“赞成定价者”与“认为价格偏高者”的月平均收入的差距是 x 1 - x 2 = 50.56 - 38.75=11.81(百元).

- 10 -

(2)根据条件可得 2×2 列联表如下: 月收入低于 55 百元的人数 认为价格 偏高者 赞成 定价者 总计
2 2

月收入不低于 55 百元的人数 3

总计

29

32

11 40

7 10

18 50

50×?7×29-3×11? K= ≈6.27<6.635, 10×40×18×32 ∴没有 99%的把握认为“月收入以 55 百元为分界点对地铁定价的态度有差异”.

[方法技巧]

^ ^ ^ ^ 1.求回归方程,关键在于正确求出系数a,b,由于a,b的计算量大,计算

^ 时应仔细谨慎,分层进行,避免因计算而产生错误. (注意线性回归方程中一次项系数为b, ^ 常数项为a,这与一次函数的习惯表示不同.) 2.回归分析是处理变量相关关系的一种数学方法.主要解决: (1)确定特定量之间是否 有相关关系,如果有就找出它们之间贴近的数学表达式;(2)根据一组观察值,预测变量的取 值及判断变量取值的变化趋势;(3)求出线性回归方程. [易错防范] 1.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散

点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意 义.根据回归方程进行预报,仅是一个预报值,而不是真实发生的值. 2.独立性检验中统计量 K 的观测值 k 的计算公式很复杂,在解题中易混淆一些数据的意 义,代入公式时出错,而导致整个计算结果出错. 真题演练集训 1.[2015·福建卷]为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区 5 户家庭,得到如下统计数据表: 收入 x(万元) 支出 y(万元) 8.2 6.2 8.6 7.5 10.0 8.0 11.3 8.5 11.9 9.8
2

^ ^ ^ ^ ^ - ^ 根据上表可得回归直线方程y=bx+a,其中b=0.76,a= y -b 一户年收入为 15 万元家庭的年支出为( A.11.4 万元 B.11.8 万元 )

x .据此估计,该社区

- 11 -

C.12.0 万元 D.12.2 万元 答案:B 解析:由题意知,

x= y=

8.2+8.6+10.0+11.3+11.9 =10, 5 6.2+7.5+8.0+8.5+9.8 =8, 5

^ ∴ a=8-0.76×10=0.4, ^ ∴ 当 x=15 时,y=0.76×15+0.4=11.8(万元). 2.[2016·新课标全国卷Ⅲ]下图是我国 2008 年至 2014 年生活垃圾无害化处理量(单位: 亿吨)的折线图.

注:年份代码 1-7 分别对应年份 2008-2014. (1)由折线图看出,可用线性回归模型拟合 y 与 t 的关系,请用相关系数加以说明; (2)建立 y 关于 t 的回归方程(系数精确到 0.01),预测 2016 年我国生活垃圾无害化处理 量. 附注:参考数据:

?yi=9.32, ?tiyi=40.17,
i=1

7

7

i=1

?yi- y ? =0.55, 7≈2.646. i=1
7
?

2

?
i=1

n

?ti- t ??yi- y ? ^ ^ ^ ,回归方程y=bt+a中斜率 ?ti- t ?
2

参考公式:相关系数 r=

?
i=1

n

?

n

?yi- y ?

2

i=1

?
^ 和截距的最小二乘估计公式分别为b=
i=1

n

?ti- t ??yi- y ? ^ ^ ,a= y -b t .
n

?
i=1

?ti- t ?

2

解:(1)由折线图中数据和附注中参考数据,得

- 12 -

t =4, ? (ti- t )2=28,
i=1

7

?
i=1

7

?yi- y ? =0.55,

2

?
i=1

7

(ti - t )(yi - y ) = ?t iyi - t
i=1

7

i=1

?yi =40.17-4×9.32= 2.89, r≈0.55×2×2.646

7

2.89

≈0.99. 因为 y 与 t 的相关系数近似为 0.99,说明 y 与 t 的线性相关程度相当高,从而可以用线 性回归模型拟合 y 与 t 的关系. 9.32 (2)由 y = ≈1.331 及(1),得 7

?
^
i=1

7

?ti- t ??yi- y ?
7

b=

?
i=1

2.89 = ≈0.103, 28 ?ti- t ?
2

^

a= y -b t ≈1.331-0.103×4≈0.92.
^ 所以,y 关于 t 的回归方程为y=0.92+0.10t. 将 2016 年对应的 t=9 代入回归方程,得 ^

^

y=0.92+0.10×9=1.82.
所以预测 2016 年我国生活垃圾无害化处理量约为 1.82 亿吨. 3.[2015·新课标全国卷Ⅰ]某公司为确定下一年度投入某种产品的宣传费,需了解年宣 传费 x(单位:千元)对年销售量 y(单位:t)和年利润 z(单位:千元)的影响.对近 8 年的年宣 传费 xi 和年销售量 yi(i=1,2,?,8)数据作了初步处理,得到下面的散点图及一些统计量的 值.

x

y

w

? (xi
i=1

8

? (wi
i=1

8

? (xi-
i=1

8

? (wi-
i=1

8

- 13 -

-x) 46.6 563 6.8 289.8

2

-w) 1.6

2

x )(yi- y )
1 469

w )(yi- y )
108.8

18 表中 wi= xi, w = ? 8i=1

xi.

(1)根据散点图判断,y=a+bx 与 y=c+d x哪一个适宜作为年销售量 y 关于年宣传费 x 的回归方程类型?(给出判断即可,不必说明理由) (2)根据(1)的判断结果及表中数据,建立 y 关于 x 的回归方程. (3)已知这种产品的年利润 z 与 x, y 的关系为 z=0.2y-x.根据(2)的结果回答下列问题: ①年宣传费 x=49 时,年销售量及年利润的预报值是多少? ②年宣传费 x 为何值时,年利润的预报值最大? 附:对于一组数据(u1,v1),(u2,v2),?,(un,vn),其回归直线 v=α +β u 的斜率和

?
^ 截距的最小二乘估计分别为β =
i=1

n

?ui- u ??vi- v ? ^ ^ ,α = v -β u .
n

?
i=1

?ui- u ?

2

解:(1)由散点图可以判断,y=c+d x适宜作为年销售量 y 关于年宣传费 x 的回归方程 类型. (2)令 w= x,先建立 y 关于 w 的线性回归方程.

?
^ 由于d=
i=1

8

?wi- w ??yi- y ?
8

?
i=1

108.8 = =68, 1.6 ?wi- w ?
2

^

c= y -d w =563-68×6.8=100.6,
^ 所以 y 关于 w 的线性回归方程为y=100.6+68w, ^ 因此 y 关于 x 的回归方程为y=100.6+68 x. (3)①由(2)知,当 x=49 时, ^ ^ 年销售量 y 的预报值y=100.6+68 49=576.6,年利润 z 的预报值z=576.6×0.2-49 =66.32. ②根据(2)的结果知,年利润 z 的预报值 ^

^

z=0.2(100.6+68 x)-x=-x+13.6 x+20.12.

- 14 -

13.6 ^ 所以当 x= =6.8,即 x=46.24 时,z取得最大值.故年宣传费为 46.24 千元时,年 2 利润的预报值最大. 4.[2014·新课标全国卷Ⅱ]某地区 2007 年至 2013 年农村居民家庭人均纯收入 y(单位: 千元)的数 据如下表: 年份 年份代号 t 人均纯收入 y 2007 1 2.9 2008 2 3.3 2009 3 3.6 2010 4 4.4 2011 5 4.8 2012 6 5.2 2013 7 5.9

(1)求 y 关于 t 的线性回归方程; (2)利用(1)中的回归方程,分析 2007 年至 2013 年该地区农村居民家庭人均纯收入的变 化情况,并预测该地区 2015 年农村居民家庭人均纯收入. 附:回归直线的斜率和截距的最小二乘估计公式分别为:

?
^
i=1

n

?ti- t ??yi- y ? ^ ^ ,a= y -b t .
n

b=

?
i=1

?ti- t ?

2

解:(1)由所给数据计算得

t = ×(1+2+3+4+5+6+7)=4, y = ×(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,
1 7

1 7

? (ti- t )2=9+4+1+0+1+4+9=28,
i=1

7

? (ti- t
i=1

7

)(yi - y ) = (-3)×(- 1.4)+ (-2)×(-1) +( -1)×(-0.7)+0×0.1+

1×0.5+2×0.9+3×1.6=14,

?
^
i=1

7

?ti- t ??yi- y ?
7

b=

?
i=1

14 = =0.5, 28 ?ti- t ?
2

^

a= y -bt=4.3-0.5×4=2.3.

^

- 15 -

^ 所求回归方程为y=0.5t+2.3. ^ (2)由(1)知,b=0.5>0,故 2007 年至 2013 年该地区农村居民家庭人均纯收入逐年增加, 平均每年增加 0.5 千元. 将 2015 年的年份代号 t=9 代入(1)中的回归方程,得 ^

y=0.5×9+2.3=6.8,
故预测该地区 2015 年农村居民家庭人均纯收入为 6.8 千元. 课外拓展阅读 统计案例问题的规范答题 [典例] [2013·福建卷]某工厂有 25 周岁以上(含 25 周岁)工人 300 名, 25 周岁以下工

人 200 名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取 了 100 名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25 周岁以上(含 25 周岁)”和“25 周岁以下”分为两组, 再将两组工人的日平均生产件数分成 5 组: [50,60), [60,70),[70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图.

(1)从样本中日平均生产件数不足 60 件的工人中随机抽取 2 人,求至少抽到一名“25 周 岁以下组”工人的概率; (2)规定日平均生产件数不少于 80 件者为“生产能手”,请你根据已知条件完成 2×2 列 联表,并判断是否有 90%的把握认为“生产能手与工人所在的年龄组有关”?

P(K2≥k0) k0

0.100 2.706
2

0.050 3.841

0.010 6.635

0.001 10.828

n?ad-bc? 2 附:K = . ?a+b??c+d??a+c??b+d?

- 16 -

[审题视角] 验公式计算 K .
2

由频率分布直方图列举基本事件,结合古典概型,求概率.利用独立性检

[解] (1)由已知得,样本中有 25 周岁以上组工人 60 名,25 周岁以下组工人 40 名.所 以,样本中日平均生产件数不足 60 件的工人中,25 周岁以上组工人有 60×0.05=3(人),记 为 A1,A2,A3;25 周岁以下组工人有 40×0.05=2(人),记为 B1,B2. 从中随机抽取 2 名工人,所有的可能结果共有 10 种,它们是(A1,A2),(A1,A3),(A2,A3), (A1,B1), (A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2). 其中,至少有 1 名“25 周岁以下组”工人的可能结果共有 7 种,它们是(A1,B1),(A1,

B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).
7 故所求的概率 P= . 10 (2)由频率分布直方图可知,在抽取的 100 名工人中,“25 周岁以上组”中的生产能手有 60×0.25=15(人),“25 周岁以下组”中的生产能手有 40×0.375=15(人),据此可得 2×2 列联表如下: 生产能手 25 周岁以上组 25 周岁以下组 总计
2

非生产能手 45 25 70

总计 60 40 100

15 15 30

n?ad-bc? 2 所以 K = ?a+b??c+d??a+c??b+d?
100×?15×25-15×45? 25 = = ≈1.79. 60×40×30×70 14 因为 1.79<2.706,所以没有 90%的把握认为“生产能手与工人所在的年龄组有关”. [答题模板] 第 1 步:由分层抽样计算两组工人的数目; 第 2 步:由频率分布直方图计算两组不足 60 件的人数; 第 3 步:列举 5 人抽取 2 人的基本事件数; 第 4 步,由古典概型计算概率; 第 5 步:统计生产能手与非生产能手,列 2×2 列联表; 第 6 步:由公式计算 K ,确定答案. 归纳总结 100 1 1 1 (1)分层抽样比为 = ,故 25 周岁以上有 300× =60(人),25 周岁以下的 200× = 500 5 5 5 40(人),然后再根据频率计算“不足 60 件”的人数,并设定符号. (2)列 2×2 列联表时,其中的数字应先由频率分布直方图算出后再列表.
- 17 2 2


相关文章:
2018版高考数学大一轮复习第十一章统计与统计案例11.3...
2018高考数学大一轮复习第十一章统计与统计案例11....关系,则称变量间是不相关的. 2.线性回归方程 (1...7 b= ? i=1 2.89 =≈0.103, 28 ?ti- t ...
2017届高考数学一轮复习 第十章 概率与统计 课时60 变...
2017届高考数学一轮复习 第十章 概率与统计 课时60 变量间的相关关系与统计...课时60 变量间的相关关系与统计案例(课前预习案)班级: 一、高考考纲要求 1....
2018版高考数学一轮复习第十一章统计与概率11.3变量间...
2018高考数学一轮复习第十一章统计与概率11.3变量间的相关关系统计案例理 - 第十一章 统计与概率 11.3 变量间的相关关系统计案例 理 1.两个变量的线性...
版高考数学一轮复习第十章算法初步课时达标66变量间的...
高考数学一轮复习第十章算法初步课时达标66变量间的相关关系与统计案例-含答案 - 第 66 讲一、选择题 变量间的相关关系与统计案例 [解密考纲]本节内容在高考...
...统计、统计案例第3讲_变量间的相关关系与统计案例
2013高考数学()一轮复习教案:第十篇_统计、统计案例第3讲_变量间的相关关系与统计案例 隐藏>> 第3讲【2013 年高考会这样考】 变量间的相关关系与统计案例 ...
...统计与统计案例课时规范练50变量间的相关关系、统计...
2018第十章算法初步、统计与统计案例课时规范练50变量间的相关关系统计案例文 新人教A版 Word版 含答案_其它课程_高中教育_教育专区。2018高考数学单元质检...
...复习第十一章统计统计案例第三节变量间的相关关系统...
2018届高三数学一轮复习第十一章统计统计案例第三节变量间的相关关系统计案例夯基提能作业本理_数学_高中教育_教育专区。第三节 变量间的相关关系统计案例 A 组...
...(知识点归纳与总结):变量间的相关关系与统计案例
2016届高三数学一轮复习(知识点归纳与总结):变量间的相关关系与统计案例_数学_...怎么考 高考对本节内容的考查主要是线 性回归分析和独立性检验的统计 分析方法...
2018年高考数学(理)总复习高考达标检测(四十八)变量间...
2018年高考数学()总复习高考达标检测(四十八)变量间的相关关系统计案例 Word版含答案 - 高考达标检测(四十八)变量间的相关关系统计案例 一、选择题 1....
2019年高考数学一轮复习第9章算法初步、统计与统计案例...
2019年高考数学一轮复习第9章算法初步、统计与统计案例第4节变量间的相关关系统计案例学案理北师大版 - 第四节 变量间的相关关系统计案例 [考纲传真] (教师...
更多相关标签:

相关文章