当前位置:首页 >> 数学 >>

2019年高三数学二轮专题复习 专题4 概率与统计 第8讲 统计与统计案例课件 理-PPT文档资料_图文

第 8 讲 统计与统计案例

【命题趋势】 本节在高考中主要考查:1.利用三种抽样方法解决抽 样问题;抽样方法中分层抽样是高考常考点,题型既有选 择题也有填空题,属容易题.命题时多以现实生活为背景, 主要考查基本概念及简单计算.2.利用频率分布直方图、茎 叶图求样本的数据特征,估计总体的数字特征;估计总体 的数字特征是命题的热点,多与概率统计相结合出题.3. 对相关变量进行回归分析和独立性检验;其考查力度比往 年加大,主要考查独立性检验的意义,多以解答题出现, 难度不大.

【备考建议】 本节考点与实际问题联系紧密,复习中不能依赖记忆 公式和简单的套用公式解题,应在充分认识统计方法特点 的基础上,深刻理解回归分析和独立性检验的基本思想、 方法及初步应用,提高阅读能力,找准数学模型,经历较 为系统的数据处理的全过程,培养对数据的直观感觉,另 外还要有意识的提高运算能力.

探究一 抽样方法
例 1 (1)高三某班有学生 56 人,现将所有同学随机编 号,用系统抽样的方法,抽取一个容量为 4 的样本,已知 5 号、33 号、47 号学生在样本中,则样本中还有一个学 生的编号为( )
A.13 B.17 C.19 D.21
【解析】选 C. 用系统抽样方法从 56 名学生中抽取 4 人,则分段间 隔为 14,若第一段抽出的号码为 5,则其它段抽取的号码 应为:19,33,47.

(2)为了研究雾霾天气的治理,某课题组对部分城市进 行空气质量调查,按地域特点把这些城市分成甲、乙、丙 三组,已知三组城市的个数分别为 4,y,z,依次构成等 差数列,且 4,y,z+4 成等比数列,若用分层抽样抽取 6 个城市,则乙组中应抽取的城市个数为__________.
【解析】2 由题意可得?????2yy2==44×+(z,z+4), 即???y=2+2z, 解得 z=12,或 z=-4(舍去),
??y2=4z+16, 故 y=8.所以甲、乙、丙三组城市的个数分别为 4,8,12.
因为一共要抽取 6 个城市,所以抽样比为4+86+12=14. 故乙组城市应抽取的个数为 8×14=2.

【点评】(1)在系统抽样的过程中,要注意分段间隔, 需要抽取几个个体,总体就需要分成几个组,则分段间隔
即为Nn(n 为样本容量),首先确定在第一组中抽取的个体 的号码数,再从后面的每组中按规则抽取每个个体.
(2)分层抽样中要注意按比例抽取各层次的样本数据, 样本容量与总体的个体数之比是分层抽样的比例常数,按 这个比例可以确定各层应抽取的个体数与各层原有的人 数,若各层应抽取的个体数不都是整数,则应当先剔除部 分个体,调整总体个数.

探究二 用样本估计总体
例 2 (1)某公司为了解用户对其产品的满意度,从 A,B 两地区分别随机调查了 40 个用户,根据用户对产品的满 意度评分,得到 A 地区用户满意度评分的频率分布直方图 和 B 地区用户满意度评分的频数分布表.
A 地区用户满意度评分的频率分布直方图

B 地区用户满意度评分的频数分布表

满意度评 分分组

[50,60)

[60,70)

[70,80)

[80,90)

[90,100]

频数

2

8

14

10

6

(Ⅰ)在图②中作出 B 地区用户满意度评分的频率分布

直方图,并通过直方图比较两地区满意度评分的平均值及分散

程度(不要求计算出具体值,给出结论即可).

图②

(Ⅱ)根据用户满意度评分,将用户的满意度分为三个

等级:

满意度评分 低于 70 分

70 分到 不低于 89 分 90 分

满意度等级

不满意

满意

非常满 意

估计哪个地区用户的满意度等级为不满意的概率

大?说明理由.

【解析】(Ⅰ)B 地区用户满意度评分的平均值高于 A 地区用户满意度评分的平均值;B 地区用户满意度评分比 较集中,而 A 地区用户满意度评分比较分散.
(Ⅱ)A 地区用户的满意度等级为不满意的概率大.

解:(Ⅰ)如下图所示.通过两地区用户满意度评分的 频率分布直方图可以看出,B 地区用户满意度评分的平均 值高于 A 地区用户满意度评分的平均值;B 地区用户满意 度评分比较集中,而 A 地区用户满意度评分比较分散.

(Ⅱ)判断:A 地区用户的满意度等级为不满意的概率大. 记 CA 表示事件:“A 地区用户的满意度等级为不满意”;CB 表示事件:“B 地区用户的满意度等级为不满意”.由直方图得 P(CA)的估计值为(0.01+0.02+0.03)×10=0.6,P(CB)的估计值为 (0.005+0.02)×10=0.25.所以 A 地区用户的满意度等级为不满意 的概率大.

(2)某工厂 36 名工人的年龄数据如下表.

工人编号 工人编号 工人编号 工人编号

年龄

年龄

年龄

年龄

1 40 10 36 19 27 28 34

2 44 11 31 20 43 29 39

3 40 12 38 21 41 30 43

4 41 13 39 22 37 31 38

5 33 14 43 23 34 32 42

6 40 15 45 24 42 33 53

7 45 16 39 25 37 34 37

8 42 17 38 26 44 35 49

9 43 18 36 27 42 36 39 (Ⅰ)用系统抽样法从 36 名工人中抽取容量为 9 的样本,且在

第一分段里用随机抽样法抽到的年龄数据为 44,列出样本的年龄 数据;(Ⅱ)计算(Ⅰ)中样本的均值 x 和方差 s2;
(Ⅲ)36 名工人中年龄在 x -s 与 x +s 之间有多少人?所占的百 分比是多少(精确到 0.01%)?

【解析】(Ⅰ)其年龄数据为:44,40,36,43,36,
37,44,43,37.(Ⅱ)1090.(Ⅲ) 63.89%. 解:(Ⅰ)36 人分成 9 组,每组 4 人,其中第一组抽取
的工人年龄为 44, 所以它在组中的编号为 2,所以所有样本数据的编号
为 4n-2(n=1,2,…,9), 其年龄数据为:44,40,36,43,36,37,44,43,
37. (Ⅱ)由均值公式知: x =44+40+9 …+37=40, 由方差公式知:s2=19[(44-40)2+(40-40)2+…+(37
-40)2]=1900.

(Ⅲ)因为 s2=1090,s=130, 所以 36 名工人中年龄在 x -s 和 x +s 之间的人数等于 年龄在区间[37,43]上的人数, 即 40,40,41,…,39,共 23 人. 所以 36 名工人中年龄在 x -s 和 x +s 之间的人数所占 的百分比为2336×100%≈63.89%.

【点评】(1)解决与频率分布直方图有关的问题时,应 正确理解已知数据的含义,掌握图表中各个量的意义,通 过图表对已知数据进行分类.
(2)在作茎叶图或读茎叶图时,首先要弄清楚“茎”和 “叶”分别代表什么,根据茎叶图,我们可方便地求出数 据的众数与中位数,大体上估计出两组数据平均数的大小 与稳定性的高低.

探究三 回归分析
例 3 一般来说,一个人脚掌越长,他的身高就越高.现 对 10 名成年人的脚掌长 x 与身高 y 进行测量,得到数据(单位 均为 cm)作为一个样本如表: 脚掌长
20 21 22 23 24 25 26 27 28 29 (x) 身高 (y) 141 146 154 160 169 176 181 188 197 203
(1)在上表数据中,以“脚掌长”为横坐标,“身高”为纵 坐标,作出散点图后,发现散点在一条直线附近,试求“身高”
与“脚掌长”之间的线性回归方程^y=bx+a; (2)若某人的脚掌长为 26.5 cm,试估计此人的身高.

【解析】(1)y=7x;(2)185.5 cm.

解:(1)记样本中 10 人的“脚掌长”为 xi(i=1,2,… 10),“身高”为 yi(i=1,2,…10),
∵-x =x1+x2+10…+x10=24.5,-y =y1+y2+10…+y10

n

=171.5,∴b=

?
i ?1

? xi ? x
n
?? xi

??
?

yi ?
?2
x

y

?

=58727..55=7,a=-y -b-x =0,

i ?1

∴^y=7x.

(2) 由 (2) 知 ^y = 7x , 当 x = 26.5 时 , ^y = 7×26.5 =

185.5(cm),

故估计此人的身高为 185.5 cm.

【点评】已知变量的某个值去预测与其有线性相关关 系的变量的值时,一般先求出回归直线方程^y=^bx+^a, 若^a,^b中有一个是已知的,常利用公式^a=y-^bx 求另一 个量,再把 x 取值代入回归直线方程^y=^bx+^a中,求出^y 的估计值.

探究四 独立性检验

例 4 某新闻媒体为了了解观众对央视《开门大吉》节目 的喜爱与性别是否有关系,随机调查了观看该节目的观众 110 名,得到如下的列联表:





总计

喜爱 40

20

60

不喜爱 20

30

50

总计 60

50

110

试根据样本估计总体的思想,估计约有________的把握

认为“喜爱该节目与否和性别有关”.参考附表:

P(K2≥k0) 0.050 0.010 0.001

k0

3.841 6.635 10.828

(参考公式:K2=(a+b)(cn+(da)d-(bac+)c2)(b+d),

其中 n=a+b+c+d)

【解析】99% 假设喜爱该节目和性别无关,分析列联表中数据,可 得 K2=110×6(0×405×0×306-0×205×020)2≈7.822>6.635, 所以有 99%的把握认为“喜爱《开门大吉》节目与否和 性别有关”.
【点评】独立性检验的具体步骤:第一步,根据题意 确定临界值并作无关假设;第二步,找相关数据,列出 2×2 列联表;第三步,由公式 K2 (其中 n=a+b+c+d)计算出 K2 的观测值;第四步,将 K2 的观测值与临界值进行比较, 进而作出推断.

1.进行系统抽样的关键是根据总体和样本的容量确 定分段间隔,根据第一段确定编号.如果总体不能被样本 整除,即每段不能等分,应采用等可能剔除的方法剔除部 分个体,以获得整数间隔.
2.进行分层抽样时应注意以下几点:①分层抽样中 分多少层、如何分层要视具体情况而定,总的原则是:层 内样本的差异要小,两层之间的样本差异要大,且互不重 叠;②为了保证每个个体等可能入样,所有层中每个个体 被抽到的可能性要相同;③在每层抽样时,应采用简单随 机抽样或系统抽样的方法进行抽样.

3.进行线性回归分析时应注意的问题: (1)正确理解计算^b,^a的公式和准确的计算是求线性 回归方程的关键. (2)在分析两个变量的相关关系时,可根据样本数据作 出散点图来确定两个变量之间是否具有相关关系,若具有 线性相关关系,则可通过线性回归方程估计和预测变量的 值. 4.独立性检验在实际应用中应注意的问题: (1)独立性检验的关键是根据 2×2 列联表准确计算 K2,若 2×2 列联表没有列出来,要先列出此表.
(2)复习独立性检验时,要根据实际问题,深刻体会独立性
检验的思想.

一、选择题 1.重庆市 2015 年各月的平均气温(℃)数据的茎叶图 如下:
0? 8 9 1? 2 5 8 2?? 0 0 3 3 8 3? 1 2
则这组数据的中位数是( )
A.19 B.20 C.21.5 D.23 【解析】选 B. 从茎叶图知所有数据为 8,9,12,15,18,20,20,
23,23,28,31,32,中间两个数为 20,20,故中位数为 20,选 B.

2.我校三个年级共有 24 个班,学校为了了解同学们

的心理状况,将每个班编号,依次为 1 到 24,现用系统

抽样方法,抽取 4 个班进行调查,若抽到编号之和为 48,

则抽到的最小编号为( )

A.2

B.3

C.4

D.5

【解析】选 B. 系统抽样的抽取间隔为244=6.设抽到的最小编号为 x, 则 x+(6+x)+(12+x)+(18+x)=48,所以 x=3.故 选 B.

3.若样本数据 x1,x2,…,x10 的标准差为 8,则数

据 2x1-1,2x2-1,…,2x10-1 的标准差为( )

A.8 B.15

C.16

D.32

【解析】选 C. 设样本数据 x1,x2,…,x10 的标准差为 DX,则 DX =8,即方差 DX=64,而数据 2x1-1,2x2-1,…,2x10 -1 的方差 D(2X-1)=22DX=22×64,所以其标准差为
22×64=16.选 C.

4.为了解某社区居民的家庭年收入与年支出的关系,

随机调查了该社区 5 户家庭,得到如下统计数据表:

收入 x (万元) 8.2 8.6 10.0 11.3 11.9

支出 y (万元)

6.2 7.5

8.0

8.5

9.8

根据上表可得回归直线方程^y =^b x+^a ,其中^b =0.76,^a

=-y -^b-x ,据此估计,该社区一户收入为 15 万元家庭年支

出为( )

A.11.4 万元 B.11.8 万元

C.12.0 万元 D.12.2 万元

【解析】选 B.









-x



8.2+8.6+10.0+11.3+11.9 5



10(



元),-y =6.2+7.5+85.0+8.5+9.8=8(万元),

故^a=8-0.76×10=0.4,

所以回归直线方程为^y=0.76x+0.4,

当社区一户收入为 15 万元家庭年支出为^y=0.76×15

+0.4=11.8(万元),故选 B.

二、填空题 5.为了解某校高三学生身体状况,用分层抽样的方法 抽取部分男生和女生的体重,将男生体重数据整理后,画 出了频率分布直方图,已知图中从左到右前三个小组频率 之比为 1∶2∶3,第二小组频数为 12,若全校男、女生比 例为 3∶2,则全校抽取学生数为________.

【解析】80 第四小组和第五小组的频率之和是 5×(0.012 5+ 0.037 5)=0.25,故前三个小组的频率之和是 0.75,则第二 小组的频率是 0.25,则抽取的男生人数是 12÷0.25=48 人,
抽取的女生人数是 48×23=32 人,全校共抽取 80 人.

6.为了考察某校各班参加课外书法小组的人数,在 全校随机抽取 5 个班级,把每个班级参加该小组的人数作 为样本数据.已知样本平均数为 7,样本方差为 4,且样 本数据互不相同,则样本数据中的最大值为 ____________.

【解析】选 10

设五个班级的数据分别为 a<b<c<d<e.























a+b+c+d+e 5



7



(a ? 7)2 ? (b ? 7)2 ? (c ? 7)2 ? (d ? 7)2 ? (e ? 7)2

5

=4,

显然各个括号为整数.

设 a-7,b-7,c-7,d-7,e-7 分别为 p,q,r,

s,t,(p,q,r,s,t∈Z),则?????pp+ 2+qq+2+r+r2+s+s2t=+0t2…=(201…)(2). 设 f(x)=(x-p)2+(x-q)2+(x-r)2+(x-s)2=4x2-

2(p+q+r+s)x+(p2+q2+r2+s2)=4x2+2tx+20-t2,

由已知 f(x)>0,

由判别式 Δ<0 得 t<4,

所以 t≤3,所以 e≤10.

7.关于统计数据的分析,以下几个结论中正确的是 __________.
①利用残差进行回归分析时,若残差点比较均匀地落在 宽度较窄的水平带状区域内,则说明线性回归模型的拟合精 度较高;
②将一组数据中的每个数据都减去同一个数后,期望与 方差均没有变化;
③调查剧院中观众观后感时,从 50 排(每排人数相同) 中任意抽取一排的人进行调查是分层抽样法;
④已知随机变量 X 服从正态分布 N(3,1),且 P(2≤X≤4) =0.682 6,则 P(X>4)等于 0.158 7.
⑤某单位有职工 750 人,其中青年职工 350 人,中年职工
250 人,老年职工 150 人.为了了解该单位职工的健康情况,
用分层抽样的方法从中抽取样本.若样本中的青年职工为 7
人,则样本容量为 15 人.

【解析】①④
①④正确,②③⑤错误,⑤设样本容量为 n,则1355000 =n7,
∴n=30,故⑤错.

三、解答题 8.某公司为了解用户对其产品的满意度,从 A,B 两地区分别随机调查了 20 个用户,得到用户对产品的满 意度评分如下: A 地区:62 73 81 92 95 85 74 64 53 76 78 86 95 66 97 78 88 82 76 89 B 地区:73 83 62 51 91 46 53 73 64 82 93 48 65 81 74 56 54 76 65 79

(1)根据两组数据完成两地区用户满意度评分的茎叶 图,并通过茎叶图比较两地区满意度评分的平均值及分散 程度(不要求计算出具体值,得出结论即可);

(2)根据用户满意度评分,将用户的满意度从低到高分

为三个等级:

满意度评分 低于 70 分 70 分到 89 分 不低于 90 分

满意度等级 不满意

满意

非常满意

记事件 C:“A 地区用户的满意度等级高于 B 地区 用户的满意度等级”.假设两地区用户的评价结果相互独 立.根据所给数据,以事件发生的频率作为相应事件发生 的概率,求 C 的概率.
【解析】(1)两地区用户满意度评分的茎叶图如下
通过茎叶图可以看出,A 地区用户满意度评分的平均 值高于 B 地区用户满意度评分的平均值;A 地区用户满意 度评分比较集中,B 地区用户满意度评分比较分散.

(2)记 CA1 表示事件:“A 地区用户满意度等级为满意 或非常满意”;
CA2 表示事件:“A 地区用户满意度等级为非常满 意”;
CB1 表示事件:“B 地区用户满意度等级为不满意”; CB2 表示事件:“B 地区用户满意度等级为满意”; 则 CA1 与 CB1 独立,CA2 与 CB2 独立,CB1 与 CB2 互斥, C=CB1CA1∪CB2CA2, P(C) = P(CB1CA1 ∪ CB2CA2) = P(CB1CA1) + P(CB2CA2) = P(BB1)P(CA1)+P(CB2)P(CA2). 由所给数据得 CA1,CA2,CB1,CB2 发生的概率分别为
1260,240,1200,280.故 P(CA1)=1260,
P(CA2)=240,P(CB1)=1200,P(CB2)=280, 故 P(C)=1200×1260+280×240=0.48.

9.某公司为确定下一年度投入某种产品的宣传费, 需了解年宣传费 x(单位:千元)对年销售量 y(单位:t)和年 利润 z(单位:千元)的影响,对近 8 年的年宣传费 xi 和年 销售量 yi(i=1,2,…,8)数据作了初步处理,得到下面的 散点图及一些统计量的值.

-x

-y

-w

8
?(xi ? x)2
i ?1

8
? (wi ? w)2
i ?1

8

8

? ?(xi ? x)( yi ? y)

(wi ? w)( yi ? y)

i ?1

i ?1

46.6 56.3 6.8 289.8 1.6

1469

108.8

表中 wi=

xi

,-w =18

8
?wi

i=1

(1)根据散点图判断,y=a+bx 与 y=c+d x哪一个适

宜作为年销售量 y 关于年宣传费 x 的回归方程类型?(给

出判断即可,不必说明理由)

(2)根据(1)的判断结果及表中数据,建立 y 关于 x 的

回归方程;

(3)已知这种产品的年利率 z 与 x、y 的关系为 z=0.2y

-x.

根据(2)的结果回答下列问题:(ⅰ)年宣传费 x=49 时,

年销售量及年利润的预报值是多少?(ⅱ)年宣传费 x 为何

值时,年利润的预报值最大?

附:对于一组数据(u1,v1),(u2,v2),……,(un,vn), 其回归线 v=α+βu 的斜率和截距的最小二乘估计分别

n

? (ui ? u)(vi ? v)

? i?1

为:β =

n
(ui ? u)

,? ? u ? ? u

i ?1

【解析】(1)由散点图可以判断,y=c+d x适合作为

年销售 y 关于年宣传费用 x 的回归方程类型.

(2)令 w= x,先建立 y 关于 w 的线性回归方程,由

n

于^d=

?
i ?1

(wi
n
?

? w)( yi ? (wi ? w)2

y)

=10186.8=68,

i ?1

∴^c =^y -^d -w =563-68×6.8=100.6.

∴y 关于 w 的线性回归方程为^y=100.6+68w,

∴y 关于 x 的回归方程为^y=100.6+68 x.

(3)(i)由(2)知,当 x=49 时,年销售量 y 的预报值 ^y=100.6+68 49=576.6, ^z =576.6×0.2-49=66.32. (ii)根据(2)的结果知,年利润 z 的预报值 ^z=0.2(100.6+68 x)-x=-x+13.6 x+20.12, ∴当 x=132.6=6.8,即 x=46.24 时,^z取得最大值. 故宣传费用为 46.24 千元时,年利润的预报值最大.

10.某校为了探索一种新的教学模式,进行了一项课题实验,

乙班为实验班,甲班为对比班,甲乙两班的人数均为 50 人,一

年后对两班进行测试,成绩如下表(总分:150 分):

甲班

成绩 [80,90) [90,100) [100,110) [110,120) [120,130)

频数 4

20

15

10

1

乙班

成绩 [80,90) [90,100) [100,110) [110,120) [120,130)

频数 1

11

23

13

2

(1)现从甲班成绩位于[90,120)内的试卷中抽取 9 份进

行试卷分析,请问用什么抽样方法更合理,并写出最后的

抽样结果;

(2)根据所给数据可估计在这次测试中,甲班的平均分

是 101.8,请你估计乙班的平均分,并计算两班平均分相差

几分;

(3)完成下面 2×2 列联表,你能有 97.5%的把握认为

“这两个班在这次测试中成绩的差异与实施课题实验有

关”吗?并说明理由.

成绩小于 100 分

成绩不小于 100 分

合计

甲班

a=

b=

50

乙班

c=

d=

50

合计

36

64

100

附:
P(K2≥k0) 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k0 2.072 2.706 3.841 5.024 6.635 7.879 10.828
K2=(a+b)(cn+(da)d-(bac+)c2)(b+d).

【解析】(1)用分层抽样抽取样本更合理.在[90,100),

[100,110),[110,120)各分数段分别抽取 4 份、3 份、2

份试卷.

(2)



















-x





85×

1 50



95×

11 50



105×2530+115×1530+125×520=105.8. 105.8-101.8=4,即两班平均成绩相差 4 分.

(3)a=24,b=26,c=12,d=38.

K2=100×5(0×245×0×383-6×266×4 12)2=6.25.

而 6.25>5.024,所以有 97.5%的把握认为“这两个

班在这次测试中成绩的差异与实施课题实验有关”.

一、选择题 1.某全日制大学共有学生 5 400 人,其中专科生有 1 500 人,本科生有 3 000 人,研究生有 900 人.现采用分 层抽样的方法调查学生利用因特网查找学习资料的情况, 抽取的样本容量为 180,则应在专科生、本科生与研究生 这三类学生中分别抽取( ) A.55 人,80 人,45 人 B.40 人,100 人,40 人 C.60 人,60 人,60 人 D.50 人,100 人,30 人

【解析】选 D. 抽取比例为5148000=310,故应在专科生、本科生、研究 生中分别抽取 1 500×310=50(人),3 000×310=100(人), 900×310=30(人).

2.在某中学生歌手比赛现场上,7 位评委为某选手 打出的分数的茎叶统计图如图所示,去掉一个最高分和一 个最低分后,所剩数据的平均数和方差分别为( )

A.5 和 1.6 C.85 和 0.4

B.85 和 1.6 D.5 和 0.4

【解析】选 B.

由图可知-x =80+4+4+54+6+7=85,s2=15×(1+1+1 +1+4)=1.6.

3.为了普及环保知识,增强环保意识,某大学随机 抽取 30 名学生参加环保知识测试,得分(10 分制)的直方 图如图所示,假设得分的中位数为 me,众数为 m0,平均 数为 x,则( )

A.me=m0=x C.me<m0<x

B.me=m0<x D.m0<me<x

【解析】选 D.

由图知 m0=5.将 30 名学生的得分从大到小排列,第

15 个数是 5,第 16 个数是 6,所以 me=5.5.

3? 2 ? 4 ? 3 ? 5?10 ? 6 ? 6 ? 7 ? 3 ? 8 ? 2 ? 9 ? 2 ?10 ? 2

又x =

30

>5.9,

所以 m0<me<x.

4.给出下列四个命题:

①质检员每隔 10 分钟从匀速传递的产品生产流水线

上抽取一件产品进行某项指标检测,这样的抽样是分层抽

样;

②将一组数据中的每个数据都加上同一个常数后,方

差不变;

③设随机变量 ξ 服从正态分布 N(0,1),若 P(ξ≥1)

=p,则 P(-1<ξ<0)=12-p;

④在回归直线方程^y=0.1x+10 中,当 x 每增加 1 个

单位时,^y平均增加 0.1 个单位.

其中真命题的个数是(

)

A.1 B.2 C.3 D.4

【解析】选 C. ①中的抽样方法是系统抽样,所以①不正确;根据方 差的含义,②正确;③中 P(ξ≥1)=p,则 P(ξ≤-1)=p,
所以 P(-1<ξ<0)=12(1-2p)=12-p,故③正确;由于 x 的 系数为 0.1,因此 x 每增加一个单位,^y平均增加 0.1 个单 位,故④正确.所以真命题的个数是 3.

5.某种产品的广告支出 x(单位:万元)与销售额 y(单

位:万元)之间有如下对应数据:

x 2 45

6

8

y 30 40 60 50 70

根据上表可得回归直线方程^y=^bx+^a中的^b为 6.5.若

要使销售额不低于 100 万元,则至少需要投入广告费为(x

为整数)( )

A.10 万元 B.11 万元

C.12 万元 D.13 万元

【解析】选 D. 因为 x=5,y=50,所以 50=6.5×5+^a, 解得^a=17.5, 所以回归直线方程为^y=6.5x+17.5. 由 6.5x+17.5≥100,解得 x≥11635,因为 x 为整数, 所以至少需要投入广告费为 13 万元.

6.从气象意义上来说春季进入夏季的标志为:连续

5 天的日平均温度均不低于 22℃.现有甲、乙、丙三地连

续 5 天的日平均温度的记录数据(记录数据都是正整数):

①甲地:5 个数据的中位数为 24,众数为 22;

②乙地:5 个数据的中位数为 27,总体均值为 24;

③丙地:5 个数据中有一个数据是 32,总体均值为

26,总体方差为 10.4.

则肯定进入夏季的地区为( )

A.甲、乙、丙 B.甲、丙

C.乙、丙

D.甲

【解析】选 B.

甲地气温数据的中位数为 24,即 5 个数据从小到大

排序,第 3 个数是 24,出现最多的数是 22,因此至少有

2 个 22,故甲地连续 5 天的日平均气温都不低于 22℃,

故甲地肯定进入夏季;乙地气温数据的中位数为 27,数

据尽可能集中的情况是 a1,a2,27,27,27,由均值为 24,

可得 a1+a2=39,此时 a1,a2 中至少有一个小于 22,故乙

地肯定没有进入夏季;设丙地的其他 4 个气温数据为 a1,

a2,a3,a4,



(a1 ? 26)2 ? (a2 ? 26)2 ? (a3 ? 26)2 ? (a4 ? 26)2 ? (32 ? 26)2 5

=10.4,即(a1-26)2+(a2-26)2+(a3-26)2+(a4-26)2= 16,显然(a1-26)2≤16,(a2-26)2≤16,(a3-26)2≤16,(a4 -26)2≤16,即 a1,a2,a3,a4∈[22,30],故丙地肯定进

入夏季.

二、填空题 7.某市居民 2005~2009 年家庭年平均收入 x(单位:万 元)与年平均支出 Y(单位:万元)的统计资料如下表所示:
年份 2005 2006 2007 2008 2009 收入 x 11.5 12.1 13 13.3 15 支出 Y 6.8 8.8 9.8 10 12 根据统计资料,居民年家庭平均收入的中位数是 ________,家庭年平均收入与年平均支出有________线性相 关关系.
【解析】13 正 找中位数时,将样本数据按大小顺序排列后,奇数个时 中间一个是中位数,而偶数个时须取中间两数的平均数,由 统计资料可以看出,年平均收入增多时,年平均支出也增多, 因此两者正相关.

8.某高校“统计初步”课程的教师随机调查了选该

课的一些学生情况,具体数据如下表:

性别 专业 非统计专业 统计专业



13

10



7

20

为了判断主修统计专业是否与性别有关系,根据表中

的数据,

得到 k=50×2(3×132×7×202-0×103×07)2≈4.844.

因为 k≥3.841,

所以判定主修统计专业与性别有关系,那么这种判断

出错的可能性为________.

【解析】5% ∵P(k2≥3.841)=0.05, 根据独立性检验临界值表可知“x 与 y 有关系”的可 信度, ∴有 95%的可能认为 x 与 y 有关系,即判断出错的可 能性为 5%.

9.设某大学的女生体重 y(kg)与身高 x(cm)具有线性 相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n), 用最小二乘法建立的线性回归方程为^y=0.85x-85.71,给 出下列结论:
①y 与 x 具有正的线性相关关系; ②回归直线过样本点的中心(-x ,-y ); ③若该大学某女生身高增加 1 cm,则其体重约增加 0.85 kg; ④若该大学某女生身高为 170 cm,则可断定其体重 必为 58.79 kg. 其中,正确结论的序号是______________.
【解析】①②③ 利用有关概念可知,①②③正确.

10.已知 x、y 之间的一组数据如下表:
x13678 y12345 对于表中数据,甲、乙两同学给出的拟合直线分别为
l1:y=13x+1 与 l2:y=12x+12,利用最小二乘法判断拟合 程度更好的直线是________(填 l1 或 l2).
【解析】l2 用 y=13x+1 作为拟合直线时,所得 y 值与 y 的实际值 的差的平方和为 s1=73; 用 y=12x+12作为拟合直线时,所得 y 值与 y 的实际值 的差的平方和为 s2=12. ∵s2<s1,故用直线 y=12x+12拟合程度更好.

三、解答题 11.从某企业生产的某种产品中抽取 500 件,测量这 些产品的一项质量指标值,由测量结果得如下频率分布直 方图:
(1)求这 500 件产品质量指标值的样本平均数-x 和样本方 差 s2(同一组中的数据用该组区间的中点值作代表);

(2)由直方图可以认为,这种产品的质量指标值 Z 服 从正态分布 N(μ,σ 2),其中 μ 近似为样本平均数 x,σ 2 近似为样本方差 s2.
(ⅰ)利用该正态分布,求 P(187.8<Z<212.2); (ⅱ)某用户从该企业购买了 100 件这种产品,记 X 表 示这 100 件产品中质量指标值位于区间(187.8,212.2)的产 品件数.利用(ⅰ)的结果,求 E(X). 附: 150≈12.2. 若 Z~N(μ,σ 2), 则 P(μ-σ<Z<μ+σ)=0.682 6, P(μ-2σ<Z<μ+2σ)=0.954 4.

【解析】(1)抽取产品的质量指标值的样本平均数 x 和样本方差 s2 分别为
-x = 170×0.02+ 180×0.09+ 190×0.22+ 200×0.33 +210×0.24+220×0.08+230×0.02=200,
s2=(-30)2×0.02+(-20)2×0.09+(-10)2×0.22+ 0×0.33+102×0.24+202×0.08+302×0.02=150.
(2)(ⅰ) 由 (1) 知 , Z ~ N(200 , 150) , 从 而 P(187.8<Z<212.2)=P(200-12.2<Z<200+12.2)
=0.682 6. (ⅱ) 由 (ⅰ) 知 , 一 件 产 品 的 质 量 指 标 值 位 于 区 间 (187.8,212.2)的概率为 0.682 6,依题意知 X~B(100,0.682 6),所以 E(X)=100×0.682 6=68.26.

12.考察黄烟经过药物处理跟发生青花病的关系,得 到如下数据,在试验的 470 株黄烟中,经过药物处理的黄 烟有 25 株发生青花病,60 株没有发生青花病.未经过药 物处理的有 185 株发生青花病,200 株没有发生青花病, 试推断药物处理跟发生青花病是否有关系.

【解析】由已知得到下表

经药物处理 未经药物处理 合计

患青花病

25

185

210

无青花病

60

200

260

合计

85

385

470

根据公式 k2=470×2(102×5×26200×0-851×853×8560)2≈9.788.

由于 9.788>7.879,所以我们有 99.5%的把握认为经过药物

处理跟发生青花病是有关系的.

13.为了对 2015 年佛山市中考成绩进行分析,在 60 分以上的全体同学中随机抽出 8 位,他们的数学分数(已折 算为百分制)从小到大排列是 60、65、70、75、80、85、90、 95,物理分数从小到大排列是 72、77、80、84、88、90、 93、95.
(1)若规定 85 分(包括 85 分)以上为优秀,求这 8 位同学 中恰有 3 位同学的数学和物理分数均为优秀的概率;
(2)若这 8 位同学的数学、物理、化学分数事实上对应 如下表:
学生编号 1 2 3 4 5 6 7 8 数学分数 x 60 65 70 75 80 85 90 95 物理分数 y 72 77 80 84 88 90 93 95 化学分数 z 67 72 76 80 84 87 90 92

用变量 y 与 x、z 与 x 的相关系数说明物理与数学、

化学与数学的相关程度;

(3)求 y 与 x、z 与 x 的线性回归方程(系数精确到 0.01),

并用相关指数比较所求回归模型的效果.

参考数据:-x =77.5,-y =85,-z =81,

? ? ? ? ? ? ? ? ? 8

2

8

xi ? x ? 1050 ,

2

8

yi ? y ? 456 ,

2
zi ? z ? 550 ,

i ?1

i ?1

i ?1

8

8

?? xi ? x?? yi ? y? ? 688 , ?? xi ? x?? zi ? z? ? 755 ,

i ?1

i ?1

? ? ? ? 8

2

8

2

? ? yi ? yi ? 7 , zi ? zi ? 94 ,

i?1

i ?1

1050≈32.4, 456≈21.4, 550≈23.5.

【解析】(1)这 8 位同学中恰有 3 位同学的数学和物 理分数均为优秀,则需要先从物理的 4 个优秀分数中选出
3 个与数学优秀分数对应,种数是 C34A33(或 A34),然后将剩 下的 5 个数学分数和物理分数任意对应,种数是 A55.根据 乘法原理,满足条件的种数是 C34A33A55.
这 8 位同学的物理分数和数学分数分别对应的种数 共有 A88.故所求的概率 P=C34AA8833A55=114.

(2)变量 y 与 x、z 与 x 的相关系数分别是 r=32.46×8821.4 ≈0.99,r′=32.47×5523.5≈0.99 可以看出,物理与数学、 化学与数学的成绩都是高度正相关.
(3)设 y 与 x、z 与 x 的线性回归方程分别是^y=bx+a, ^z =b′x+a′根据所给的数据可以计算出,b=1608580=0.65, a=85-0.65×77.5=34.63,b′=1705550=0.72,a′=81 -0.72×77.5=25.20 所以 y 与 x 和 z 与 x 的回归方程分别 是 =0.65x+34.63, =0.72x+25.20,又 y 与 x、z 与 x 的
相关指数是 R2=1-4756≈0.98,R′2=1-59540≈0.83 故回 归模型^y=0.65x+34.63 比回归模型^z=0.72x+25.20 的拟 合的效果好.

谢谢!
xiexie!


相关文章:
2019年高三数学二轮专题复习 专题4 概率与统计 第8讲 ....ppt
2019年高三数学二轮专题复习 专题4 概率与统计 第8讲 统计与统计案例课件 理-PPT文档资料 - 第 8 讲 统计与统计案例 【命题趋势】 本节在高考中主要考查:1....
2019年高三数学二轮专题复习 专题4 概率与统计 第8讲 ....ppt
2019年高三数学二轮专题复习 专题4 概率与统计 第8讲 统计与统计案例课件 文-PPT课件_数学_高中教育_教育专区。 第 8 讲 统计与统计案例 【命题趋势】 本节在...
...年高三数学二轮专题复习 专题4 概率与统计 第8讲 统....ppt
2017年高三数学二轮专题复习 专题4 概率与统计 第8讲 统计与统计案例课件 - 第 8 讲 统计与统计案例 【命题趋势】 本节在高考中主要考查:1.利用三种抽样...
...复习专题四概率与统计第1讲统计与统计案例课件_图文....ppt
2019高考数学二轮复习专题四概率与统计第1讲统计与统计案例课件_高考_高中教育_教育专区。第1讲 统计与统计案例 2019/5/16 教学课件资料精选 1 高考定位 1.抽样...
...年高三数学二轮专题复习 专题4 概率与统计 第8讲 统....ppt
2017年高三数学二轮专题复习 专题4 概率与统计 第8讲 统计与统计案例课件 文_数学_高中教育_教育专区。 第 8 讲 统计与统计案例 【命题趋势】 本节在高考中...
高三理科数学二轮专题复习专题4第8讲统计与统计案例_图文.ppt
搜试试 2 悬赏文档 全部 DOC PPT TXT PDF XLS ...高三理科数学二轮专题复习专题4第8讲统计与统计案例_...的数字特征是命题的热点 , 多与概率统计相结合出题...
2019届高三数学(理)二轮专题复习课件:专题四+第1讲+统....ppt
2019届高三数学(理)二轮专题复习课件:专题四+第1讲+统计与统计案例_高三数学_数学_高中教育_教育专区。@《创新设计》 第1讲 统计与统计案例 1 真题感悟 考点...
2019届高三数学(理)二轮专题复习课件:专题四 第1讲 统....ppt
2019届高三数学(理)二轮专题复习课件:专题四 第1讲 统计与统计案例_数学_高中教育_教育专区。第 1讲 统计与统计案例 高考定位 1.抽样方法、样本的数字特征、...
...复习专题四概率与统计第1讲统计与统计案例课件_图文....ppt
【精选】2019高考数学二轮复习专题四概率与统计第1讲统计与统计案例课件_高考_
...专题三 概率与统计 第3讲 统计与统计案例课件 理_图....ppt
(全国通用版)2019高考数学二轮复习-专题概率与统计 第3讲 统计与统计案例课件 理_高考_高中教育_教育专区。(全国通用版)2019高考数学二轮复习-专题三 概率与...
...复习专题三概率与统计第3讲统计与统计案例课件理_图....ppt
(全国通用版)2019高考数学二轮复习专题概率与统计第3讲统计与统计案例课件理_高考_高中教育_教育专区。板块三 专题突破 核心考点 专题概率与统计 第3讲 统计...
...部分专题六概率与统计第1讲统计与统计案例课件理_图....ppt
2019高考数学二轮复习第二部分专题概率与统计第1讲统计与统计案例课件理_高考_高中教育_教育专区。专题概率与统计 第 1 讲 统计与统计案例 1.(2018全国...
2019版高考数学二轮复习第1篇专题4统计与概率第1讲小题....ppt
2019版高考数学二轮复习第1篇专题4统计与概率第1讲小题考法统计统计案例概率课件_高考_高中教育_教育专区。第一篇 二轮专题突破专题四 统计与概率第1讲...
...专题7 概率与统计 第1讲 统计与统计案例课件_图文.ppt
(文理通用)2019届高考数学二轮复习-第1部分 专题7 概率与统计 第1讲 统计与统计案例课件_高考_高中教育_教育专区。第一部分专题强化突破专题概率与统计 ...
...部分专题六概率与统计第1讲统计与统计案例课件理_图....ppt
【精选】2019高考数学二轮复习第二部分专题概率与统计第1讲统计与统计案例课件理_高考_高中教育_教育专区。专题概率与统计 第 1 讲 统计与统计案例 1.(...
...复习专题三概率与统计第3讲统计与统计案例课件理_图....ppt
2019高考数学二轮复习专题概率与统计第3讲统计与统计案例课件理_高考_高中教育_教育专区。板块三 专题突破 核心考点 专题概率与统计 第3讲 统计与统计案例 [...
...第1部分专题7概率与统计第1讲统计与统计案例课件_图....ppt
(文理通用)2019届高考数学二轮复习第1部分专题7概率与统计第1讲统计与统计案例课件_高考_高中教育_教育专区。第一部分 专题强化突破 专题概率与统计 知识网络...
...复习专题四概率与统计第1讲统计与统计案例课件理_图....ppt
高考数学二轮复习专题四概率与统计第1讲统计与统计案例课件理_高考_高中教育_教育
2018-2019届高三数学(理)二轮复习课件:专题3第7讲统计....ppt
2018-2019届高三数学(理)二轮复习课件:专题3第7讲统计与统计案例_数学_高中教育_教育专区。 新课标全国卷有关统计概率的考查以 2 道客观题 考查排列、组合...
2019版高考数学二轮复习第1篇专题4统计与概率第1讲小题....ppt
2019版高考数学二轮复习第1篇专题4统计与概率第1讲小题考法__统计统计案例概率课件_高考_高中教育_教育专区。篇 二轮专题突破 专题四 统计与概率 第1讲 小题...