当前位置:首页 >> 高中教育 >>

2015届高考数学(理)二轮专题配套练习:专题七 第3讲 统计与统计案例]


第3讲
考情解读

统计与统计案例

1. 该部分常考内容:样本数字特征的计算、各种统计图表、线性回归方程、独立性

检验等;有时也会在知识交汇点处命题,如概率与统计交汇等.2. 从考查形式上来看,大部分 为选择题、填空题,重在考查基础知识、基本技能,有时在知识交汇点处命题,也会出现解 答题,都属于中、低档题.



1.随机抽样 (1)简单随机抽样特点是从总体中逐个抽取.适用范围:总体中的个体较少. (2)系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取.适用范围:总 体中的个体数较多. (3)分层抽样特点是将总体分成几层,分层进行抽取.适用范围:总体由差异明显的几部分组 成. 2.常用的统计图表 (1)频率分布直方图 ①小长方形的面积=组距× 频率 =频率; 组距

②各小长方形的面积之和等于 1; 频率 1 ③小长方形的高= ,所有小长方形的高的和为 . 组距 组距 (2)茎叶图 在样本数据较少时,用茎叶图表示数据的效果较好. 3.用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数

数字特征 众数

样本数据 出现次数最多的数据 将数据按大小依次排列, 处在最中间位

频率分布直方图 取最高的小长方形底边中点的横坐标 把频率分布直方图划分左右两个面积

中位数

置的一个数据(或最中间两个数据的平 均数)

相等的分界线与 x 轴交点的横坐标 每个小矩形的面积乘以小矩形底边中 点的横坐标之和

平均数

样本数据的算术平均数

1 2 2 2 2 (2)方差:s = [(x1 - x ) +(x2 - x ) +?+(xn - x ) ]. n 标准差: s= 1 [?x - x ?2 +?x2 - x ?2 +?+?xn - x ?2 ] . n 1

4.变量的相关性与最小二乘法 (1)相关关系的概念、正相关和负相关、相关系数. (2)最小二乘法:对于给定的一组样本数据(x1 ,y1 ),(x2 ,y2 ),?,(xn ,yn),通过求 Q= ? (yi
i =1 n

-a-bxi )2 最小时,得到线性回归方程y=bx+a的方法叫做最小二乘法. 5.独立性检验 对于取值分别是{x1 ,x2 }和{y1 ,y2 }的分类变量 X 和 Y,其样本频数列联表是 y1 x1 x2 总计 a c a+c y2 b d b+d 总计 a+b c+d n

^

^

^

n?ad-bc?2 则 K2 (χ2 )= (其中 n=a+b+c+d 为样本容量). ?a+b??c+d??a+c??b+d?

热点一 例1

抽样方法

(1)(2013· 陕西)某单位有 840 名职工, 现采用系统抽样方法抽取 42 人做问卷调查, 将 840 )

人按 1,2,?,840 随机编号,则抽取的 42 人中,编号落入区间[481,720]的人数为( A. 11 B.12 C.13 D.14

(2)(2014· 石家庄高三调研)某学校共有师生 3 200 人,现用分层抽样的方法,从所有师生中抽取 一个容量为 160 的样本, 已知从学生中抽取的人数为 150, 那么该学校的教师人数是________. 思维启迪 (1)系统抽样时需要抽取几个个体,样本就分成几组,且抽取号码的间隔相同;(2)

分层抽样最重要的是各层的比例. 答案 解析 = (1)B (2)200 720-480 840 (1)由 =20, 即每 20 人抽取 1 人, 所以抽取编号落入区间[481,720] 的人数为 42 20

240 =12. 20

160 160-150 (2)本题属于分层抽样,设该学校的教师人数为 x,所以 = ,所以 x=200. 3 200 x

思维升华

(1)随机抽样各种方法中, 每个个体被抽到的概率都是相等的; (2)系统抽样又称“等

距”抽样,被抽到的各个号码间隔相同;分层抽样满足:各层抽取的比例都等于样本容量在 总体容量中的比例. (1)某校高一、高二、高三分别有学生人数为 495,493,482,现采用系统抽样方法, 抽取 49 人做问卷调查,将高一、高二、高三学生依次随机按 1,2,3,?,1 470 编号,若第 1 组有简单随机抽样方法抽取的号码为 23,则高二应抽取的学生人数为( A.15 B.16 C.17 D.18 )

(2)(2014· 广东)已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中 小学生的近视形成原因,用分层抽样的方法抽取 2%的学生进行调查,则样本容量和抽取的高 中生近视人数分别为( )

A.200,20 C.200,10 答案 解析 (1)C (2)A

B.100,20 D.100,10

(1)由系统抽样方法,知按编号依次每 30 个编号作为一组,共分 49 组,高二学生的编

号为 496 到 988,在第 17 组到第 33 组内,第 17 组抽取的编号为 16×30+23=503,为高二 学生,第 33 组抽取的编号为 32×30+23=983,为高二学生,故共抽取高二学生人数为 33- 16=17,故选 C. (2)该地区中、小学生总人数为 3 500+2 000+4 500=10 000, 则样本容量为 10 000×2%=200,其中抽取的高中生近视人数为 2 000×2%×50%=20,故选 A. 热点二 例2 用样本估计总体

(1)(2014· 山东)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的

舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17] ,将其按从左 到右的顺序分别编号为第一组,第二组,?,第五组,如图是根据试验数据制成的频率分布 直方图.已知第一组与第二组共有 20 人,第三组中没有疗效的有 6 人,则第三组中有疗效的 人数为( )

A.6

B.8

C.12

D.18

(2)PM2.5 是指大气中直径小于或等于 2.5 微米的颗粒物,也称为可入肺颗粒物,如图是根据某 地某日早 7 点至晚 8 点甲、乙两个 PM2.5 监测点统计的数据(单位:毫克/每立方米)列出的茎叶 图,则甲、乙两地浓度的方差较小的是( A.甲 C.甲乙相等 B.乙 D.无法确定 甲 2 9 6 3 2 3 6 思维启迪 3 1 1 4 7 0.04 0.05 0.06 0.07 0.08 0.09 1 9 2 9 7 2 4 6 9 2 乙 3 6 )

(1)根据第一组与第二组的人数和对应频率估计样本总数,然后利用第三组的频率

和无疗效人数计算;(2)直接根据公式计算方差. 答案 解析 (1)C (2)A 20 (1)志愿者的总人数为 =50, ?0.16+0.24?×1

所以第三组人数为 50×0.36=18, 有疗效的人数为 18-6=12. (2) x甲 =(0.042+0.053+0.059+0.061+0.062+0.066+0.071+0.073+0.073+0.084+0.086+ 0.097)÷ 12≈0.068 9, x乙 = (0.041 + 0.042 + 0.043 + 0.046 + 0.059 + 0.062 + 0.069 + 0.079 + 0.087 + 0.092 + 0.094 + 0.096)÷ 12≈0.067 5, 1 s2 = [(0.042-0.068 9)2 +(0.053-0.068 9)2 +…+(0.097-0.068 9)2 ]≈0.000 212. 12 1 2 2 2 2 s = [(0.041-0.067 5) +(0.042-0.067 5) +…+(0.096-0.067 5) ]≈0.000 429. 12 所以甲、乙两地浓度的方差较小的是甲地. 思维升华 (1)反映样本数据分布的主要方式:频率分布表、频率分布直方图、茎叶图.关于

频率分布直方图要明确每个小矩形的面积即为对应的频率,其高低能够描述频率的大小,高 考中常常考查频率分布直方图的基本知识,同时考查借助频率分布直方图估计总体的概率分 布和总体的特征数,具体问题中要能够根据公式求解数据的均值、众数和中位数、方差等. (2)由样本数据估计总体时,样本方差越小,数据越稳定,波动越小. (1)某商场在庆元宵促销活动中,对元宵节 9 时至 14 时的销售额进行统计,其频

率分布直方图如图所示,已知 9 时至 10 时的销售额为 2.5 万元,则 11 时至 12 时的销售额为 ________万元.

(2)(2014· 陕西)设样本数据 x1 ,x2 ,?,x10 的均值和方差分别为 1 和 4,若 yi =xi +a(a 为非零 常数,i=1,2,?,10),则 y1 ,y2 ,?,y10 的均值和方差分别为( A.1+a, 4 C.1,4 答案 解析 (1)10 (2)A B.1+a, 4+a D.1,4+a )

(1)由频率分布直方图可知:

0.10 2.5 = ,所以 x=10. 0.40 x x1 +x2 +?+x10 (2) =1,yi =xi +a, 10 所以 y1 ,y2 ,?,y10 的均值为 1+a,方差不变仍为 4. 故选 A. 热点三 例3 统计案例

(1)以下是某年 2 月某地区搜集到的新房屋的销售价格 y 和房屋的面积 x 的数据. 房屋面积 x/m2 销售价格 y/万元
^ ^ ^

115 24.8
^

110 21.6

80 18.4

135 29.2

105 22

根据上表可得线性回归方程y=bx+a中的b=0.196 2,则面积为 150 m2 的房屋的销售价格约为 ________万元. (2)(2014· 江西)某人研究中学生的性别与成绩、视力、智商、阅读量这 4 个变量的关系,随机 抽查 52 名中学生, 得到统计数据如表 1 至表 4, 则与性别有关联的可能性最大的变量是( 表1 成绩 性别 男 女 总计 6 10 16 表2 14 22 36 20 32 52 不及格 及格 总计 )

视力 性别 男 女 总计

好 4 12 16 表3

差 16 20 36

总计 20 32 52

智商 性别 男 女 总计 表4 阅读量 性别 男 女 总计 A. 成绩 思维启迪 B.视力 C.智商 D.阅读量 丰富 14 2 16 不丰富 6 30 36 总计 20 32 52 8 8 16 12 24 36 20 32 52 偏高 正常 总计

(1)回归直线过样本点中心( x , y );

(2)根据列联表,计算 K2 的值 答案 解析 (1)31.244 2 (2)D

1 (1)由表格可知 x = (115+110+80+135+105)=109, 5

1 y = (24.8+21.6+18.4+29.2+22)=23.2. 5
^ ^

所以a= y -b x =23.2-0.196 2×109=1.814 2.
^

所以所求线性回归方程为y=0.196 2x+1.814 2.
^

故当 x=150 时,销售价格的估计值为y=0.196 2×150+1.814 2=31.244 2(万元). (2)A 中,a=6,b=14,c=10,d=22,a+b=20,c+d=32,a+c=16,b+d=36,n=52, 52×?6×22-14×10? 13 K2 = = . 20×32×16×36 1 440 B 中,a=4,b=16,c=12,d=20,a+b=20,c+d=32,a+ c=16,b+d=36,n=52, 52×?4×20-16×12? 637 K2 = = . 20×32×16×36 360
2 2

C 中,a=8,b=12,c=8,d=24,a+b=20,c+d=32,a+c=16,b+d=36,n=52, 52×?8×24-12×8? 13 K2 = = . 20×32×16×36 10 D 中,a=14,b=6,c=2,d=30,a+b=20,c+d=32,a+c=16,b+d=36,n=52, 52×?14×30-6×2? 3 757 2 K= = . 20×32×16×36 160 ∵ 13 13 637 3 757 < < < , 1 440 10 360 160
2 2

∴与性别有关联的可能性最大的变量是阅读量. 思维升华 (1)线性回归方程求解的关键在于准确求出样本点中心.回归系数的求解可直接把

相应数据代入公式中求解, 回归常数的确定则需要利用中心点在回归直线上建立方程求解; (2) 独立性检验问题,要确定 2×2 列联表中的对应数据,然后代入 K2 (χ2 )计算公式求其值,根据 K2 (χ2 )取值范围求解即可. (1)已知 x、y 取值如下表: x y 0 1.3 1 1.8 4 5.6
^

5 6.1
^

6 7.4
^

8 9.3 )

从所得的散点图分析可知:y 与 x 线性相关,且y=0.95x+a,则a等于( A.1.30 B.1.45 C.1.65 D.1.80

(2)某研究机构为了研究人的脚的大小与身高之间的关系, 随机抽测了 20 人, 若“身高大于 175 厘米”的为“高个”,“身高小于等于 175 厘米”的为“非高个”,“脚长大于 42 码”的为 “大脚”,“脚长小于等于 42 码”的为“非大脚”.得以下 2×2 列联表: 高个 大脚 非大脚 总计 5 1 6 非高个 2 12 14 总计 7 13 20

则在犯错误的概率不超过________的前提下认为人的脚的大小与身高之间有关系. (附: P (K2 >k ) k ) 答案 解析 (1)B (2)0.01 1 (1)依题意得, x = ×(0+1+4+5+6+8)=4, 6 0.05 3.841 0.01 6.635 0.001 10.828

1 y = (1.3+1.8+5.6+6.1+7.4+9.3)=5.25; 6
^ ^ ^

又直线y=0.95x+a必过样本点中心( x , y ),即点(4,5.25),于是有 5.25=0.95×4+a,由此

^

解得a=1.45. (2)由题意得 20×?5×12-1×2? K2 = ≈8.802>6.635. 6×14×7×13 而 K2 >6.635 的概率约为 0.01,所以在犯错误的概率不超过 0.01 的前提下认为人的脚的大小与 身高之间有关系.
2

1.随机抽样的方法有三种,其中简单随机抽样适用于总体中的个体数量不多的情况,当总体 中的个体数量明显较多时要使用系统抽样,当总体中的个体具有明显的层次时使用分层抽 样.系统抽样最重要的特征是“等距”,分层抽样,最重要的是各层的“比例”. 2.用样本估计总体 (1)在频率分布直方图中,各小长方形的面积表示相应的频率,各小长方形的面积的和为 1. (2)众数、中位数及平均数的异同:众数、中位数及平均数都是描述一组数据集中趋势的量, 平均数是最重要的量. (3)当总体的个体数较少时,可直接分析总体取值的频率分布规律而得到总体分布;当总体容 量很大时,通常从总体中抽取一个样本,分析它的频率分布,以此估计总体分布. 1n 1n ①总体期望的估计,计算样本平均值 x = ∑ x . ②总体方差 ( 标准差 ) 的估计:方差= ∑ (x - i ni =1 ni =1 i x )2 ,标准差= 方差,方差(标准差)较小者较稳定.
^ ^ ^

3.线性回归方程y =b x+a 过样本点中心( x , y ),这为求线性回归方程带来很多方便. 4.独立性检验 (1)作出 2×2 列联表.(2)计算随机变量 K2 (χ2)的值.(3)查临界值,检验作答.

真题感悟 1.(2014· 江苏)为了了解一片经济林的生长情况,随机抽测了其中 60 株树木的底部周长(单位: cm),所得数据均在区间[80,130] 上,其频率分布直方图如图所示,则在抽测的 60 株树木中, 有________株树木的底部周长小于 100 cm.

答案 解析

24 底部周长在[80,90)的频率为 0.015×10=0.15,

底部周长在[90,100) 的频率为 0.025×10=0.25, 样本容量为 60,所以树木的底部周长小于 100 cm 的株数为(0.15+0.25)×60=24. 2.(2014· 重庆)已知变量 x 与 y 正相关,且由观测数据算得样本平均数 x =3, y =3.5,则由 该观测数据算得的线性回归方程可能是(
^ ^

)

A. y=0.4x+2.3
^

B. y=2x-2.4
^

C. y=-2x+9.5 答案 解析 A

D. y=-0.3x+4.4

因为变量 x 和 y 正相关,则回归直线的斜率为正,故可以排除选项 C 和 D.

因为样本点的中心在回归直线上,把点(3,3.5) 的坐标分别代入选项 A 和 B 中的线性回归方程 进行检验,可以排除 B,故选 A. 押题精练 1.某地区对某路段公路上行驶的汽车速度实施监控,从中抽取 50 辆汽车进行测速分析,得 到如图所示的时速的频率分布直方图,根据该图,时速在 70 km/h 以下的汽车有________辆.

答案 解析

20 时速在 70 km/h 以下的汽车所占的频率为 0.01×10+0.03×10=0.4,共有 0.4×50=

20(辆). 2.某教育出版社在高三期末考试结束后,从某市参与考试的考生中选取 600 名学生对在此期 间购买教辅资料的情况进行调研,得到如下数据: 购买图书情况 只买试题类 只买讲解类 试题类和讲解类都买

人数

240

200

160

若该教育出版社计划用分层抽样的方法从这 600 人中随机抽取 60 人进行座谈,则只买试题类 的学生应抽取的人数为________. 答案 解析 24 只买试题类的学生应抽取的人数为 60× 240 =24. 600

3. 下表提供了某厂节能减排技术改造后在生产 A 产品过程中记录的产量 x(吨)与相应的生产能 耗 y(吨)的几组对应数据: x y 3 2.5 4 t 5 4 6 4.5
^

根据上表提供的数据,求出 y 关于 x 的线性回归方程为 y=0.7x+0.35,那么表中 t 的值为 ________. 答案 解析 3 ∵样本点中心为?4.5,

?

11+t? 11+t ,∴ =0.7×4.5+0.35,解得 t=3. ? 4 4

4.春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问 100 名性别不同的 居民是否能做到“光盘”行动,得到如下的列联表: 做不到“光盘” 男 女 附: P (K2 ≥k 0 ) k0 n?ad-bc? 2 K= ?a+b??c+d??a+c??b+d? 参照附表,得到的正确结论是( )
2

能做到“光盘” 10 15

45 30

0.10 2.706

0.05 3.841

0.025 5.024

A.在犯错误的概率不超过 1%的前提下,认为“该市居民能否做到‘光盘’与性别有关” B.在犯错误的概率不超过 1%的前提下,认为“该市居民能否做到‘光盘’与性别无关” C.有 90%以上的把握认为“该市居民能否做到‘光盘’与性别有关” D.有 90%以上的把握认为“该市居民能否做到‘光盘’与性别无关” 答案 解析 C 由 公式可计 算 K2 的观 测值 k = n?ad-bc?2 100×?45×15-30×10?2 = ?a+b??c+d??a+c??b+d? 55×45×75×25

≈3.03>2.706,所以有 90%以上的把握认为“ 该市民能否做到‘ 光盘’与性别有关 ”,故选 C.

(推荐时间:40 分钟) 一、选择题 1.(2014· 湖南)对一个容量为 N 的总体抽取容量为 n 的样本,当选取简单随机抽样、系统抽样 和分层抽样三种不同方法抽取样本时, 总体中每个个体被抽中的概率分别为 p1 , p2 , p3 , 则( A.p1 =p2 <p3 B.p2 =p3 <p1 C.p1 =p3 <p2 D.p1 =p2 =p3 答案 解析 D 由于三种抽样过程中,每个个体被抽到的概率都是相等的,因此 p1 =p2 =p3. )

2.某中学高中一年级有 400 人,高中二年级有 320 人,高中三年级有 280 人,现从中抽取一 个容量为 200 人的样本,则高中二年级被抽取的人数为( A.28 C.40 答案 解析 D 由已知,得样本容量为 400+320+280=1 000, B.32 D.64 )

200 所以,高中二年级被抽取的人数为 ×320=64,选 D. 1 000 3.(2013· 江西)总体由编号为 01,02,?,19,20 的 20 个个体组成,利用下面的随机数表选取 5 个个体,选取方法是从随机数表第 1 行的第 5 列和第 6 列数字开始由左到右依次选取两个数 字,则选出来的第 5 个个体的编号为( 7816 3204 A.08 C.02 答案 解析 D 从第 1 行第 5 列、第 6 列组成的数 65 开始由左到右依次选出的数为:08,02,14,07,01, 6572 9234 0802 4935 B.07 D.01 ) 6314 8200 0702 3623 4369 4869 9728 6938 0198 7481

所以第 5 个个体编号为 01. 4.为了了解某城市今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频 率分布直方图(如图),已知图中从左到右的前 3 个小组的频率之比为 1∶2∶3,第 2 小组的频 数为 120,则抽取的学生人数是( )

A.240 C.320 答案 解析 D

B.280 D.480

由频率分布直方图知:学生的体重在 65~75 kg 的频率为(0.012 5+0.037 5) ×5=0.25,

则学生的体重在 50~65 kg 的频率为 1-0.25=0.75. 2 从左到右第 2 个小组的频率为 0.75× =0.25. 6 所以抽取的学生人数是 120÷ 0.25=480. 5.某产品在某零售摊位上的零售价 x(单位:元)与每天的销售量 y(单位:个)的统计资料如下 表所示: x y
^ ^ ^

16 50
^

17 34

18 41

19 31

由上表可得线性回归方程y=bx+a中的b=-4,据此模型预计零售价定为 15 元时,每天的销 售量为( A.48 个 C.50 个 答案 解析 B
^

) B.49 个 D.51 个

由题意知 x =17.5, y =39,代入线性回归方程得a=109,109-15×4=49,故选 B.

6.某校为了研究学生的性别和对待某一活动的态度(支持和不支持的两种态度)的关系,运用 2×2 列联表进行独立性检验,经计算 K =7.069,则所得到的统计学结论是:有________的把 握认为“学生性别与支持该活动有关系.”( 附: P (K ≥k 0 ) k0 A.0.1% C.99% 答案 解析 C 因为 7.069 与附表中的 6.635 最接近,所以得到的统计学结论是:有 1-0.010=0.99=
2 2

)

0.100 2.706 B.1%

0.050 3.841

0.025 5.024

0.010 6.635

0.001 10.828

D.99.9%

99%的把握认为“学生性别与支持该活动有关系”,选 C.

7. 某苗圃基地为了解基地内甲、乙两块地种植的同一种树苗的长势情况, 从两块地各随机抽取了 10 株树苗,用茎叶图表示上述两组数据,对两块 地抽取树苗的高度的平均数 x 甲, x 乙和中位数 y 甲,y 乙进行比较,下面 结论正确的是( )

A. x 甲> x 乙,y 甲>y 乙 B. x 甲< x 乙,y 甲<y 乙 C. x 甲< x 乙,y 甲>y 乙 D. x 甲> x 乙,y 甲<y 乙 答案 B

二、填空题 8.从某中学高一年级中随机抽取 100 名同学,将他们的成绩(单位:分)数据绘制成频率分布 直方图(如图).则这 100 名学生成绩的平均数、中位数分别为________.

答案 解析

125,124 由图可知(a+a-0.005)×10=1-(0.010+0.015+0.030) ×10,解得 a=0.025,则 x =

105×0.1+115×0.3+125×0.25+135×0.2+145×0.15=125. 中位数在 120~130 之间, 设为 x, 则 0.01×10+0.03×10+0.025×(x-120)=0.5,解得 x=124. 9. 某校开展“爱我海西、爱我家乡”摄影比赛,9 位评委为参赛作品 A 给 出的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分后,算得 平均分为 91, 复核员在复核时, 发现有一个数字(茎叶图中的 x)无法看清, 若记分员计算无误, 则数字 x 应该是__________. 答案 解析 1 89+89+92+93+92+91+94 640 当 x≥4 时, = ≠91, 7 7 89+89+92+93+92+91+x+90 =91, 7

∴x<4,∴ ∴x=1.

10.(2013· 辽宁)为了考察某校各班参加课外书法小组的人数,从全校随机抽取 5 个班级,把每 个班级参加该小组的人数作为样本数据,已知样本平均数为 7,样本方差为 4,且样本数据互

不相同,则样本数据中的最大值为________. 答案 解析 10 设 5 个班级中参加的人数分别为 x1 ,x2 ,x3 ,x4 ,x5 , x1 +x2 +x3 +x4 +x5 =7, 5

则由题意知

(x1 -7)2 +(x2 -7)2 +(x3 -7)2 +(x4 -7)2 +(x5 -7)2 =20, 五个整数的平方和为 20,则必为 0+1+1+9+9=20, 由|x-7|=3 可得 x=10 或 x=4. 由|x-7|=1 可得 x=8 或 x=6. 由上可知参加的人数分别为 4,6,7,8,10, 故最大值为 10. 三、解答题 11.(2014· 课标全国Ⅱ)某地区 2007 年至 2013 年农村居民家庭人均纯收入 y(单位:千元)的数 据如下表: 年份 年份代号 t 人均纯收入 y 2007 1 2.9 2008 2 3.3 2009 3 3.6 2010 4 4.4 2011 5 4.8 2012 6 5.2 2013 7 5.9

(1)求 y 关于 t 的线性回归方程; (2)利用(1)中的回归方程, 分析 2007 年至 2013 年该地区农村居民家庭人均纯收入的变化情况, 并预测该地区 2015 年农村居民家庭人均纯收入. 附:回归直线的斜率和截距的最小二乘估计公式分别为:

^

i =1

? ?ti - t ??yi - y ?
^ n ^

n

b=
i =1

,a= y -b t .

? ? ti - t ? 2



1 (1)由所给数据计算得 t = (1+2+3+4+5+6+7)=4, 7

1 y = (2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3, 7

i= 1

?= (ti- t )2=9+4+1+0+1+4+9=28,
? (ti - t )(yi - y )=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9
7

7

i= 1

+3×1.6=14,

^

i =1

? ?ti - t ??yi - y ?

i =1

7

b=

? ? ti - t ? 2
^

7

14 =0.5, 28

^

a= y -b t =4.3-0.5×4=2.3,
^

所求线性回归方程为y=0.5t+2.3.
^

(2)由(1)知,b=0.5>0,故 2007 年至 2013 年该地区农村居民家庭人均纯收入逐年增加,平均 每年增加 0.5 千元.
^

将 2015 年的年份代号 t=9 代入(1)中的线性回归方程,得y=0.5×9+2.3=6.8, 故预测该地区 2015 年农村居民家庭人均纯收入为 6.8 千元. 12.某城市随机抽取一年(365 天)内 100 天的空气质量指数 API 的监测数据,结果统计如下: API 空气 质量 天数 4 13 18 30 9 [0,50] 优 (50, 100] 良 (100,150] 轻微污染 (150,200] 轻度污染 (200,250] 中度污染 (250, 300] 中重度污 染 11 15 >300 重度污染

(1)若某企业每天由空气污染造成的经济损失 S(单位:元)与空气质量指数 API(记为 w)的关系 式为: 0, 0≤w≤100 ? ? S=?4w-400,100<w≤300 ? ?2 000, w>300 元且不超过 600 元的概率; (2)若本次抽取的样本数据有 30 天是在供暖季,其中有 8 天为重度污染.完成下面 2×2 列联 表,并判断能否有 95%的把握认为该市本年空气重度污染与供暖有关? 非重度污染 供暖季 非供暖季 合计 附: P (K ≥k 0 ) k0
2

,试估计在本年度内随机抽取一天,该天经济损失 S 大于 200

重度污染

合计

100

0.25 1.323
2

0.15 2.072

0.10 2.706

0.05 3.841

0.025 5.024

0.010 6.635

0.005 7.879

0.001 10.828

n?ad-bc? K2 = . ?a+b??c+d??a+c??b+d?



(1)设“在本年内随机抽取一天,该天经济损失 S 大于 200 元且不超过 600 元”为事件 A ,

由 200<S≤600,得 150<w≤250,频数为 39, 39 所以 P (A )= . 100 (2)根据以上数据得到如下列联表: 非重度污染 供暖季 非供暖季 合计 100×?63×8-22×7?2 K 的观测值 k = 85×15×30×70
2

重度污染 8 7 15

合计 30 70 100

22 63 85

≈4.575>3.841. 所以有 95%的把握认为空气重度污染与供暖有关.


相关文章:
【步步高】2015届高考数学(理科,全国通用)二轮专题配套word版练习:专题七 第3讲 统计与统计案例]
【步步高】2015届高考数学(理科,全国通用)二轮专题配套word版练习:专题七 第3讲 统计与统计案例]_高考_高中教育_教育专区。【步步高】2015届高考数学(理科,全国通用...
【步步高】(广东专用)2015届高考数学二轮复习 专题训练七 第3讲 统计与统计案例 理
【步步高】(广东专用)2015届高考数学二轮复习 专题训练七 第3讲 统计与统计案例 理_高考_高中教育_教育专区。第3讲考情解读 统计与统计案例 1.该部分常考内容:...
高考数学(理)二轮练习【专题7】(第3讲)统计与统计案例(含答案)
高考数学(理)二轮练习专题7】(第3讲)统计与统计案例(含答案)_高考_高中教育...并预测该地区 2015 年农村居民家庭人均纯收入. 附:回归直线的斜率和截距的最小...
【金版学案】2015高考数学(理)二轮专题复习作业:专题七 第三讲 统计、统计案例]
【金版学案】2015高考数学(理)二轮专题复习作业:专题七 第三讲 统计统计案例]_高中教育_教育专区。【金版学案】2015高考数学(理)二轮专题复习作业:专题七 第三...
高考数学(理)二轮专题练习【专题7】(3)统计与统计案例(含答案)
高考数学(理)二轮专题练习专题7】(3)统计与统计案例(含答案)_高考_高中教育_教育专区。第3讲 统计与统计案例 考情解读 1.该部分常考内容:样本数字特征的计算...
2016高考数学理科二轮复习习题:专题7第三讲 统计、统计案例
2016高考数学理科二轮复习习题:专题7第三讲 统计统计案例_数学_高中教育_教育专区。专题七 概率与统计、推理与证明、算法初步、框图、 复数第三讲 统计统计案例...
2016高考数学(理)专题专练:专题七 第三讲 统计、统计案例
2016高考数学(理)专题练:专题七 第三讲 统计统计案例_高三数学_数学_高中教育_教育专区。2016高考数学(理)专题专练 数学(理科) 班级:___ 姓名:___ 第一...
2015届高考数学(理)二轮专题配套练习:概率与统计
2015届高考数学(理)二轮专题配套练习:概率与统计_数学_高中教育_教育专区。概率...则该 班学生中能报 A 专业的人数为___. 答案 20 3.众数:在一组数据中,...
【2015高考三模数学汇编】专题7 概率与统计第3讲 统计与统计案例(理卷B)
2015高考三模数学汇编】专题7 概率与统计第3讲 统计与统计案例(理卷B)_高中教育_教育专区。专题 7 概率与统计 第3讲 统计与统计案例(B 卷) 一、选择题(...
更多相关标签: