当前位置:首页 >> 数学 >>

【五年经典推荐 全程方略】高三数学 专项精析精炼 考点44 随机抽样、用样本估计总体、变量间的

考点 44

随机抽样、用样本估计总体、

变量间的相关关系、统计案例
一、选择题 1.(2011·福建卷文科·T4)在某校选修乒乓球课程的学生中,高一年级有 30 名,高二年 级有 40 名.现用分层抽样的方法在这 70 名学生中抽取一个样本,已知在高一年级的学生中 抽取了 6 名,则在高二年级的学生中应抽取的人数为( (A)6 (B)8 (C)10 (D)12 )

【思路点拨】根据分层抽样的特点,各层的样本容量之比等于每一层的总体容量之比,根据 此关系可确定高二年级的学生中应抽取的人数. 【精讲精析】选 B .分层抽样的原则是按照各部分所占的比例抽取样本,设从高二年级抽取 的学生数为 n ,则

30 6 ? ,得 n ? 8 . 40 n

2.(2011·山东高考理科·T7)某产品的广告费用 x 与销售额 y 的统计数据如下表:

? 为 9.4, ? ?a ? ? bx ? 中的 b 根据上表可得回归方程 y 据此模型预报广告费用为 6 万元时销售额
为( ) (B)65.5 万元 (C)67.7 万元 (D)72.0 万元

(A)63.6 万元

【思路点拨】本题可先利用公式求出回归直线方程,再预报广告费用为 6 万元时的销售额. 【精讲精析】选 B.由表可计算 x ?

4? 2?3?5 7 49 ? 26 ? 39 ? 54 ? ,y? ? 42 ,因为点 4 2 4 7 7 ? 为 9.4, ? ?a ? , 解得 a ? 9.1 ,故回归 ? ? bx ? 上,且 b ( , 42) 在回归直线 y 所以 42 ? 9.4 ? ? a 2 2

? ? 9.4 x ? 9.1 , 令 x=6 得 y ? ? 65.5,选 B. 方程为 y
3.(2011·山东高考文科·T8)某产品的广告费用 x 万元与销售额 y 万元的统计数据如下 表:

? 为 9.4,据此模型预报广告费用为 6 万元时,销 ? ?a ? ? bx ? 中的 b 根据上表可得回归方程 y
售额为( ) (B)65.5 万元 (C)67.7 万元 (D)72.0 万元

(A)63.6 万元

【思路点拨】本题可先利用公式求出回归直线方程,再预报广告费用为 6 万元时销售额. 【精讲精析】选 B.由表可计算 x ?

4? 2?3?5 7 49 ? 26 ? 39 ? 54 ? ,y? ? 42 ,因为点 4 2 4 7 7 ? 为 9.4, ? ?a ? , 解得 a ? 9.1 ,故回归 ? ? bx ? 上,且 b ( , 42) 在回归直线 y 所以 42 ? 9.4 ? ? a 2 2

? ? 9.4 x ? 9.1 , 令 x=6 得 y ? ? 65.5,故选 B. 方程为 y
4. (2011·湖南高考理科·T4)通过随机询问 110 名性别不同的大学生是否爱好某项运动, 得到如下的列表: 男 爱好 不爱好 总计 40 20 60 女 20 30 50 总计 60 50 110



n(ad ? bc) 2 K ? 算得, (a ? b)(c ? d)(a ? c)(b ? d)
2

K2 ?

110 ? (40 ? 30 ? 20 ? 20) 2 ? 7.8. 60 ? 50 ? 60 ? 50

附表:

P( K 2 ? k )
k

0.050 3.841

0.010 6.635 )

0.001 10.828

参照附表,得到的正确结论是(

(A)在犯错误的概率不超过 0.1%的前提下,认为“爱好该项运动与性别有关”

(B)在犯错误的概率不超过 0.1%的前提下,认为“爱好该项运动与性别无关” (C)有 99%以上的把握认为“爱好该项运动与性别有关” (D)有 99%以上的把握认为“爱好该项运动与性别无关” 【思路点拨】本题考查独立性检验基础知识和运用知识的实际能力. 【精讲精析】选 C.因为 K C. 5. (2011·湖南高考文科 T5)通过随机询问 110 名性别不同的大学生是否爱好某项运动, 得到如下的列表: 男 爱好 不爱好 总计 40 20 60 女 20 30 50 总计 60 50 110
2

? 7.8 ? 6.635 ,所以相关的概率大于 1-0.010=0.99,所以选

由K 2 ? K2 ?

n(ad ? bc) 2 算得, (a ? b)(c ? d)(a ? c)(b ? d)

110 ? (40 ? 30 ? 20 ? 20) 2 ? 7.8. 60 ? 50 ? 60 ? 50

附表:

P(K 2 ? k)
k

0.050 3.841 )

0.010 6.635

0.001 10.828

参照附表,得到的正确结论是(

(A)有 99%以上的把握认为“爱好该项运动和性别有关” (B)有 99%以上的把握认为“爱好该项运动和性别无关” (C)在犯错误的概率不超过 0.1%的前提下,认为“爱好该项运动与性别有关” (D)在犯错误的概率不超过 0.1%的前提下,认为“爱好该项运动与性别无关” 【思路点拨】本题考查独立性检验基础知识和运用知识的实际能力. 【精讲精析】选 A. 因为 K ? 7.8 ? 6.635 ,所以相关的概率大于 1-0.010=0.99,所以选
2

A. 6. (2011· 江西高考理科· T6)变量 X 与 Y 相对应的一组数据为 (10, 1) , (11.3,2) , (11.8,3) , (12.5,4) (13,5) , ; 变量 U 与 V 相对应的一组数据为 (10,5) (11.3,4) , , (11.8,3) , (12.5,2) ,

(13,1), r1 表示变量 Y 与 X 之间的线性相关系数, r2 表示变量 V 与 U 之间的线性相关系数, 则( ) (B)0< r2 < r1 (D) r2 = r1

(A) r2 < r1 <0 (C) r2 <0< r1

【思路点拨】 先根据数据作出 X 与 Y 及 U 与 V 的散点图, 再根据散点图判断出变量之间的正 负相关. 【精讲精析】选 C.由散点图可得:变量 Y 与 X 正相关,变量 V 与 U 负相关,故 r1 ? 0, r2 ? 0. 7. (2011·江西高考文科·T7)为了普及环保知识,增强环保意识,某大学随机抽取 30 名学生参加环保知识测试,得分(十分制)如图所示,假设得 分值的中位数为 me ,众数为 m0 ,平均值为 x ,则( (A) me = m0 = x (B) me = m0 < x (C) me < m0 < x (D) m0 < me < x 【思路点拨】首先将这 30 个数据按照大小顺序排列,易得中位数,众数,最后计算平均值. 【精讲精析】选 D.由题目所给的统计图可知,30 个数据按大小顺序排列好后,中间两个数 为 5,6 , 故 中 位 数 为 )

me ?

5?6 ? 5.5, 2









m0 ? 5, 平均值 x ?

3 ? 2 ? 4 ? 3 ? 5 ?10 ? 6 ? 6 ? 7 ? 3 ? 8 ? 2 ? 9 ? 2 ? 10 ? 2 30

?

179 ,? m 0 ? m e ? x. 30

8.(2011·江西高考文科·T8)为了解儿子身高与其父亲身高的关系,随机抽取 5 对父子 的身高数据如下: 父亲身高 x(cm) 儿子身高 y(cm) 174 175 ) 176 175 176 176 176 177 178 177

则 y 对 x 的线性回归方程为(

(A) y ? x ?1 (B) y ? x ? 1 (C) y ? 88 ? (D) y ? 176

1 x 2

1 x 的附近. 2 1 【精讲精析】 选 C.将表中的五组数据分别代入选项验证, 可知 y ? 88 ? x 最适合. 2
【思路点拨】由散点图可知,表中五组数据大体在 y ? 88 ? 9. (2011·陕西高考理科·T9)设 ( x1, y1 ),( x2 , y2 ) ,…, ( xn , yn ) 是变量 x 和 y 的 n 个样本点,直线 l 是由这些样本点通过最小二乘法得到的线性回归直线(如图) ,以 下结论中正确的是( )

(A) x 和 y 的相关系数为直线 l 的斜率 (B) x 和 y 的相关系数在 0 到 1 之间 (C)当 n 为偶数时,分布在 l 两侧的样本点的个数一定相同 (D)直线 l 过点 ( x, y ) 【思路点拨】根据最小二乘法的有关概念:样本点的中心,相关系数,线性回归直线的意义 等进行判断. 【精讲精析】选 D. 选项 A 斜程度;它们的计算公式也不相同 相关系数的值有正有负,还可以是 0;当相关系数在 0 到 1 之间时,两 B 个变量为正相关,在-1 到 0 之间时,两个变量为负相关 C 不正确 具体分析 相关系数用来衡量两个变量之间的相关程度,直线的斜率表示直线的倾 不正确 结论

l 两侧的样本点的个数分布与 n 的奇偶性无关,也不一定是平均分布
回 归 直 线 l 一 定 过 样 本 点中 心 ( x, y ) ; 由 回 归 直 线 方 程的 计 算 公 式

不正确

D

正确

a ? y ? bx 可知直线 l 必过点 ( x, y )

10. (2011·陕西高考文科·T9)设 ( x1 , y1 ),( x2 , y2 ), · · · , ( xn , yn ) 是变量 x 和 y 的 n 个样 本点,直线 l 是由这些样本点通过最小二乘法得到的线性回归直线(如图) ,以下结论正确 的是( )

(A) 直线 l 过点 ( x, y ) (B) x 和 y 的相关系数为直线 l 的斜率 (C) x 和 y 的相关系数在 0 到 1 之间 (D)当 n 为偶数时,分布在 l 两侧的样本点的个数一定相同 【思路点拨】根据最小二乘法的有关概念:样本点的中心,相关系数,线性回归方程的意义 等进行判断. 【精讲精析】选 A.

选项

具体分析 回 归 直 线 l 一 定 过 样 本 点中 心 ( x, y ) ; 由 回 归 直 线 方 程的 计 算 公 式

结论

A

正确

a ? y ? bx 可知直线 l 必过点 ( x, y )

相关系数用来衡量两个变量之间的相关程度,直线的斜率表示直线的倾 B 斜程度,它们的计算公式也不相同 不正确

相关系数的值有正有负,还可以是 0;当相关系数在 0 到 1 之间时,两 C 个变量为正相关,在 ?1 到 0 之间时,两个变量为负相关 不正确

D

l 两侧的样本点的个数分布与 n 的奇偶性无关,也不一定是平均分布

不正确

二、填空题 11. (2011.天津高考理科.T9)一支田径队有男运动员 48 人,女运动员 36 人,若用分层抽 样的方法从该队的全体运动员中抽取一个容量为 21 的样本,则抽取男运动员的人数为 ___________. 【思路点拨】根据抽取样本的比例计算.

21 1 【精讲精析】 ? 48= ? 48=12 . 48+36 4
【答案】12 12.(2011·浙江高考文科·T13)某中学为了解学生数学课程的学习情况,在 3 000 名学 生中随机抽取 200 名, 并统计这 200 名学生的某次数学考试成绩, 得到了样本的频率分布直 方图(如图).根据频率分布直方图推测这 3 000 名学生在该次数学考试中成绩小于 60 分的 学生数是____________.

【思路点拨】本题主要考查由频率分布直方图求某组的频率. 【精讲精析】 在该次数学考试中成绩小于 60 分共有 3 组,频率之和为 0.02+0.06+0.12=0.2, 所以在该次数学考试中成绩小于 60 分的学生数大约为 3 000 ?0.2 =600 名. 【答案】600 名 三、解答题 13. (2011·安徽高考文科·T20)某地最近十年粮食需求量逐年上升,下表是部分统计数 据: 年份 2002 2004 2006 2008 2010

需求量 (万吨) 236

246

257

276

286

(Ⅰ)利用所给数据求年需求量与年份之间的回归直线方程 y ? bx ? a ; (Ⅱ)利用(Ⅰ)中所求出的直线方程预测该地 2012 年的粮食需求量. 【思路点拨】将数据处理一下,方便计算,然后利用公式求回归直线方程,并进行预测. 【精讲精析】 (Ⅰ)由所给数据看出,年需求量与年份之间是近似直线上升,下面来求回归 直线方程,先将数据预处理如下: 年份-2006 需求量-257 由预处理的数据,容易算得 -4 -21 -2 -11 0 0 2 19 4 29

x ? 0, y ? 3.2
b? (?4) ? (?21) ? (?2) ? (?11) ? 2 ? 19 ? 4 ? 29 260 ? 6 .5 . = 42 ? 22 ? 22 ? 42 40

a ? y ? b x ? 3.2 .由上述计算结果,知所求回归直线方程为
y ? 257 ? b( x ? 2006 ) ? a ? 6.5( x ? 2006 ) ? 3.2. ) ? 260.2. 即 y ? 6.5( x ? 2006
(Ⅱ)利用所求得的直线方程,可预测 2012 年的粮食需求量为 6.5×(2012-2006)+260.2=6.5×6+260.2=299.2(万吨)≈300(万吨).
? ?