当前位置:首页 >> 数学 >>

吉林省东北师范大学附属中学2015届高三文科数学一轮复习:变量间的相关关系、统计案例


一、知识梳理:(必修 3 教材 84-93,选修 1-2,1-19;) 1.散点图:表示具有相关关系的两个变量组成一组数据,将各级数据在平面直角坐标系 中描点,这种图形叫散点图。 2.两个变量的线性关系 (1)正相关:在散点图中,点散布在从左下角到右上角的区域,两个变量的这种相关关 系称为正相关; (2)负相关:在散点图中,点散布在从右下角到左上角的区域,两个变量的这种相关关 系

称为正负相关; (3)线性相关关系,回归直线 如果散点图中的点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线 性相关关系,这条直线叫做回归直线。 3.线性回归方程: (1)最小二乘法:求回归直线使得样本数据的点到回归直线的距离的平方和最小的方法 叫做最小二乘法。 (2)线性回归方程 方程 是两个具有线性相关关系的变量的一组数据(x1,y1) , (x2,y2) ,??, (xn,yn) 的线性回归方程,其中 b 是回归方程斜率,a 是截距,计算公式如下:,它主要用来估计和预 测取值及变化趋势。 4.回归分析: 通过散点图直观了解两个相关变量间的关系,然后通过最小二乘法建立回归模型,最后 通过分析相关系数、随机误差评价回归模型的好坏,这就是回归分析的基本思想。如果回归 比较好地刻画了两个相关变量的关系,以自变量的某个值,就可以通过回归模型预测相应回 归变量的值。 (1)相关系数:统计中用相关系数 r 来衡量两个变量之间的线性关系的强弱,若相应于变 量 x 的 取 值 xi , 变 量 y 的 观 测 值 为 yi ( 1 ) ,则两个变量的相关系数的计算公式为 r= ,当 r 时,表明两具变量正相关,当 r 时,表明两个变量负相关,r 的绝对值越接近 1,表明两个变量的相关性越强,当 r 的绝对值越接近于 0 时,表明两个变量 之间几乎不存在线性相关关系,通常当 r 的绝对值大于 0.75 时,认为两个变量有很强的线性相 关关系.() (2) 随机误差: ①在线性回归模型:y=bx+a+e 中,a,b 为模型中的未知数,e 是 y 与=bx+a 之间的误差,通常 e 为随机变量,称为随机误差. ②线性回归方程完整表达方式为: ,随机误差 e 的方差越小,通过回归直线=bx+a 预报真实值 y 的精确度越高. (3)残差分析: ①残差:对于样本点(x1,y1) , (x2,y2) ,??, (xn,yn)而言,它们的随机误差为=-=-()残差。 ②残差图:作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重的估计 值等,这样作出的图形为残差图。 ③残差平方和:== ,称为残差的平方和。 我们可以用残差的平方和衡量回归方程的预报精度;残差平方和越小,模型的拟合效果越 好;残差的平方和越大,模型的拟合效果越差。 (4)相关指数:我们也可以用= 来刻画回归效果,越小,意味着残差平方和越大,模型

-1-

的拟合效果越差;越大,意味着残差平方和越小,模型的拟合效果越好,说明解释变量和预 报变量的线性相关性越强。 5、独立性检验: (1)分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变 量。 (2)列联表:列出两个分类变量的频数表,称为列联表。 (3)2 列联表:假设有两个分类变量 X 和 Y,它们的可能取值分别为 和,其样本频数列 联表称为 2 列联表。 总计 a c 总计 a+c b d b+d a+b c+d a+b+c+d

(4)判断两个分类变量 x 与 y 是否有关系的方法: ①通过等高条形图,可以直接地反映数据情况,粗略地判断两个分类变量是否有关系, 但无法精确地给出所得结论的可靠程度。 ②独立性检验:利用随机变量 来判断“两个分类变量有关系”的方法,具体做法如下:

b.计算随 机变量的观测值 k: = ,其中 n=a+b+c+d 为样本容量. c.如果 k> 就以(1- P())的把握推断“X 与 Y 有关系” ,否则,就认为在样本数据中没有发现足够 的证据支持结论“X 与 Y 有关系” 。 二、题型探究 [探究一]相关关系判断 例 1:下面是水稻产量与施化肥量的一组观测数据 施化肥量 15 20 25 30 35 40 45
水稻产量

320

330

360

410

460

470

480

(1) 将上述数据制成散点图:

(2)你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水稻产量会一直随施化肥 量的增加而增加吗?

-2-

[探究二]求回归直线方程 例 2:在 2009 年十一国庆 8 天黄金周期间,某市物价部门,对本市五个商场销售的某商 品的一天销售量及其价格进行调查,五个商场的售价 x 元和销售量 y 件之间的一组数据如下 表所示: 价格 x 9 9.5 10 10.5 11 销售量 y 11 10 8 6 5 通过分析,发现销售量 y 对商品的价格 x 具有线性相关关系,则销售量 y 对商品的价格 x 的回归直线方程为________.

[探究三] 线性回归分析: 例 3:下表提供了某厂节油降耗技术实施后生产甲种门产品的过程中所记录的产量 x(吨)与 相应的生产能耗 y(吨标准煤)的几组对应数据: x 3 4 5 6 y 2.5 3 4 4.5 (1) 请画出上表数据的散点图;

(2) 请根据上表所提供的数据,用最小二乘法求出 y 关于 x 的线性回归方程

(3) 已知该厂改革技术前 100 吨甲产品的生产能耗为 90 吨标准煤,试根据(2)求出的线 性回归方程,预测生产 100 吨甲产品的生产能耗比改革技术前降低多少吨标准吨?

[探究四]独立性检验 例 4:某企业为了更好地了解设备改造前后与生产合格品的关系,随机抽取了 180 件产品进行 分析,其中设备改造前的合格品有 36 件,不合格品有 49 件,设备改造后生 产的合格品有 65 件,不合格品有 30 件.根据所给数据: (1)写出 2×2 列联表; (2)判断产品是否合格与设备改造是否有关.

-3-

三、方法提升 1、对于相关关系的理解应注意:相关关系与函数关系不同,函数关系是一种确定的关系,而 相关系是一种非确定的关系,它包括了两种情况: (1)两个变量中,一个为可控制变量,另 一个为随机变量,例如化肥的施肥量与农作物的产量之间的关系是相关关系,其中施肥量是 一个可控制的变量,而农作物的产量是随机变量;两具变量均为随机变量。 2、线性回归分析以散点图为基础,具有很强的直观性,拟合效果的好坏可以通过观察图形直 接判断;没有散点图时,可以用公式求出 r, 再做判断即可,其中 r 的大小只说明是否相关 并不能说明拟合效果的好坏,才是判断拟效果好坏的依据。 3、独立性检验是一种假设性检验,没有直观性,须依靠 的观测值 k 来对假设进行判断,应 注意是一个随机变量,则 k 是取定的一组数 a,b,c,d 后的一个确定值。 四、反思感悟:

五、课时作业 一、选择题 1.下列选项中,两个变量具有相关关系的是( ) A.正方形的面积与周长 B.匀速行驶车辆的行驶路程与时间 C.人的身高与体重 D.人的身高与视力
^

2.对有线性相关关系的两个变量建立 的回归直线方程y=a+bx 中,回归系数 b( A.不能小于 0 B.不能大于 0 C.不能等于 0 D.只能小于 0

)

3.(2009 年高考宁夏、海南卷)对变量 x、y 有观测数据(xi,yi)(i=1,2,?,10),得散点图 1;对变量 u,v 有观测数据(ui,vi)(i=1,2,?,10),得散点图 2.由这两个散点图可以判断 ( )

-4-

A.变量 x 与 y 正相关,u 与 v 正相关 C.变量 x 与 y 负相关,u 与 v 正相关

B.变量 x 与 y 正相关,u 与 v 负相关 D.变量 x 与 y 负相关,u 与 v 负相关

4.下列关系属于线性负相关的是( ) A.父母的身高与子女身高的关系 B.球的体积与半径之间的关系 C.汽车的重量与汽车每消耗 1 L 汽油所行驶的平均路程 D.一个家庭的收入与支出
^

5.下列有关回归直线方程y=bx+a 的叙述正确的是( ①反映 y 与 x 之间的相关关系; ②反映 y 与 x 之间的函数关系; ③表示 y 与 x 之间的不确定关系; ④表示最接近 y 与 x 之间真实关系的一条直线. A.①② B.②③ C.③④ D.①④
^

)

6.设有一个回归方程y=3-5x,变量 x 增加一个单位时( A.y 平均增加 3 个单位 B.y 平均减少 5 个单位 C.y 平均增加 5 个单位 D.y 平均减少 3 个单位

)

7.如果有 95%的把握说事件 A 和 B 有关系,那么具体计算出的数据( 2 2 A.K >3.841 B.K <3.841 2 2 C.K >6.635 D.K <6.635

)

8.对两个变量 y 和 x 进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),?,(xn,yn), 则下列说法中不 正确的是( ) .
^ ^ ^

A.由样本数据得到的回归方程y=bx+a必 过样本中心( x , y ) B.残差平方和越小的模型,拟合的效果越好 2 2 C.用相关指数 R 来刻画回归效果,R 越小,说明模型的拟合效果越好 D.若变量 y 和 x 之间的相关系数为 r=-0.9362,则变量 y 和 x 之间具有线性相关关系
^

9.已知回归方程y=2x+1,而试验得到一组数据是(2,4.9),(3,7.1),(4,9.1),则残差平

-5-

方和是( ) A.0.01 C.0 .03

B.0.02 D.0.04

二、填空题
^

10.已知回归方程y=4.4x+838.19,则可估计 x 与 y 的增长速度之比约为________. 11.下面是一个 2×2 列联表 则表中 a、b 处的值分别为________.

[来源:学科网 ZXXK]

12.如图所示,有 5 组(x,y)数据,去掉________组数据后, 剩下的 4 组数据的线性相关性最大.

x1 x2
总计

y1 a
网 ZXXK]

y2
21 25 46

[来源:学科

2

总计 73 27

b

13.下列说法: ①将一组数据中的每个数据都加上或减去同一 方差恒不变;
[来源:学§科§网 Z§X§X§K]

个常数后,

^

②回归方程y=bx+a 必过点( x , y ); ③曲线上的点与该点的坐标之间具有相关关 系; 2 ④在一个 2×2 列联表中, 由计算得 K =13.079, 则其两个变量间有关系的可 能性是 90%. 其中错误的是________. 三、解答题 14.在某地区的 12~30 岁居民中随机抽取了 10 个人的身高和体重的统计资料如表: 身高(cm) 143 156 159 172 165 171 177 161 164 160 体重(kg) 41 49 61 79 68 69 74 69 68 54 根据上述数据,画出散点图并判断居民的身高和体重之间是否有相关关系.

15.(2009 年高考辽宁卷)某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值 落在[29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出了 500 件,量其内径尺 寸,得结果如下表: 甲厂:

乙厂:

(1)试分别估计两个分厂生产的零件的优质品率;

[来源:

-6-

学.科.网 Z.X.X.K]

(2)由以上统计数据填下面 2×2 列联表, 并问是否有 99%的把握认为“两个分厂生产的零 件的质量有差异”. 甲厂 乙厂 合计 优质品 非优质品 合计 2 n ( ad - bc ) 2 附K= , (a+b)(c+d)(a+c)(b+d)

X§K]

16.某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究, 他们分别记录了 12 月 1 日至 12 月 5 日的每天昼夜温差与实验室每天每 100 颗种子中的发芽 数,得到如下资料: 日期 12 月 1 日 12 月 2 日 12 月 3 日 12 月 4 日 12 月 5 日 温差 x(℃) 10 11 13 12 8 发芽数 y(颗) 23 25 30 26 16 该农科所确定的研究方案是:先从这 5 组数据中选取 2 组,用剩下的 3 组数据求线性回 归方程,再对被选取的 2 组数据进行检验. (1)求选取的 2 组数据恰好是不相邻 2 天数据的概率; (2)若选取的是 12 月 1 日与 12 月 5 日的 2 组数据, 请根据 12 月 2 日至 12 月 4 日的数据,
^ ^ ^

求出 y 关于 x 的线性回归方程y=bx+a; (3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过 2 颗,则认为 得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?

六. 【对点训练】:变量的相关性、回归分析和独立性检验 1.(2012· 广东省东莞市模拟)在回归分析中,残差图中纵坐标为( A.残差 B.样本编号 - C. x D.yi )

2.(2013· 湛江测试)已知回归直线的斜率的估计值为 1.23,样本点的中心为(4,5),则回归 直线方程为( ) A.y =1.23x+4 B.y =1.23x+5 C.y =1.23x+0.08 D.y =0.08x+1.23

-7-

3.在下列各图中,两个变量具有相关关系的图是(

)

A.(1)(2) B.(1)(3) C.(2)(4) D.(2)(3) 4.(2013· 临沂市质量检测)为了调查某地区老年人是否需要志愿者提供帮助,用简单随机 抽样方法从该地区调查了 200 位老年人,结构如下: 性别是否需要志愿者 男 女 70 40 需要 30 60 不需要 附: P(K2>k) 0.050 0.010 0.001 k 3.841 6.635 10.828 参照附表,得到的正确结论是( A ) A.在犯错误的概率不超过 0.1%的前提下,认为“该地区的老年人是否需要志愿者提供 帮助与性别有关” B.在犯错误的概率不超过的 0.1%的前提下,认为“该地区的老年人是否需要志愿者提 供帮助与性别无关” C.最多有 99%的把握认为“该地区的老年人是否需要志愿者提供帮助与性别有关” D.最多有 99%的把握认为“该地区的老年人是否需要志愿者提供帮助与性别无关” 5.(2012· 石家庄市质检)经调查某地若干户家庭的年收入 x(万元)和年饮食支出 y(万元)具 有线性相关关系,并得到 y 关于 x 的线性回归直线方程:y =0.245x+0.321,由回归直线方程 可知,家庭年收入每增加 1 万元,年饮食支出平均增加 0.245 万元. 6.(2012· 山东省淄博量检测)下表是降耗技术改造后生产甲产品过程中记录的产量 x(吨) 与相应的生产能耗 y(吨标准煤)的几组对应数据,根据表中提供的数据,求出 y 关于 x 的线性 回归方程 y =0.7x+0.35,那么表中 m 的值为 3 . x 3 4 5 6 y 2.5 m 4 4.5 7.(2012· 广东罗定市第二次模拟)某研究小组为了研究中学生的身体发育情况,在某学校 随机抽出 20 名 15 至 16 周岁的男生,将他们的身高和体重制成 2×2 的列联表,根据列联表 的数据,可以有 97.5 %的把握认为该学校 15 至 16 周岁的男生的身高和体重之间有关系. 超重 不超重 合计 4 1 5 偏高 3 12 15 不偏高 7 13 20 合计 独立性检验临界值表: 0.025 0.010 0.005 0.001 P(K2≥k0) k0 5.024 6.635 7.879 10.828 独立性检验随机变量 K2 值的计算公式: n?ad-bc?2 2 K= ,n=a+b+c+d. ?a+b??c+d??a+c??b+d?

-8-

8.下表是某小卖部 6 天卖出热茶的杯数与当天气温的对比表: 26 18 13 10 4 气温/℃ -1 20 24 34 38 50 64 杯数 (1)将上表中的数据制成散点图; (2)你能从散点图中发现温度与卖出热茶的杯数近似成什么关系吗? (3)如果近似成线性相关关系,请求出线性回归方程来近似地表示这种线性相关关系; (4)如果某天的气温是-5 ℃时,用(3)的回归方程预测这天小卖部卖出热茶的杯数.

9.(2012· 辽宁卷改编)电视传媒公司为了了解某地区电视观众对某类体育节目的收视情 况,随机抽取了 100 名观众进行调查.下面是根据调查结果绘制的观众日均收看该体育节目 时间的频率分布直方图:

将日均收看该体育节目时间不低于 40 分钟的观众称为“体育迷”.根据已知条件完成下 面的列联表,并据此资料你是否认为“体育迷”与性别有关? 非体育迷 体育迷 合计 男 10 55 女 合计 n?ad-bc?2 附:K2= , ?a+c??b+d??a+b??c+d? P(K2≥k) k 0.05 3.841 0.01 6.635

-9-


相关文章:
吉林省东北师范大学附属中学2015届高三文科数学一轮复习:变量间的相关关系、统计案例
吉林省东北师范大学附属中学2015届高三文科数学一轮复习:变量间的相关关系统计案例_数学_高中教育_教育专区。一、知识梳理:(必修 3 教材 84-93,选修 1-2,1-...
吉林省东北师范大学附属中学2015届高三文科数学一轮复习:抛物线[1]
吉林省东北师范大学附属中学2015届高三文科数学一轮复习:抛物线[1]_数学_高中教育_教育专区。抛物线[1](教案) 一、 知识梳理: 1. 抛物线的定义 定义的理解: 定...
吉林省东北师范大学附属中学2015届高考数学
吉林省东北师范大学附属中学2015届高考数学_高三数学_数学_高中教育_教育专区。...≠1, 故 x∈(0,1). 东北师大附中 2014-2015 高三数学第二轮专题复习[文科...
吉林省东北师范大学附属中学2015届高三文科数学一轮复习:轨迹与轨迹方程
吉林省东北师范大学附属中学2015届高三文科数学一轮复习:轨迹与轨迹方程_数学_高中...“坐标化”将其转化为寻求变量间的关系问题,解决这类 问题不但对圆锥曲线的...
吉林省东北师范大学附属中学2015届高三理科高考总复习阶段测试卷 数学
吉林省东北师范大学附属中学2015届高三理科高考总复习阶段测试卷 数学_高中教育_教育...随机变量 X 1 (万元) , 根据市场分析, X 1 的分布列为: X1 P 12 1 ...
2016届吉林省东北师范大学附属中学2016届高三上学期文科数学第一轮复习阶段测试卷(第12周) Word版含答案
2016届吉林省东北师范大学附属中学2016届高三上学期文科数学一轮复习阶段测试卷(第12周) Word版含答案_高三数学_数学_高中教育_教育专区。2016届吉林省东北师范...
吉林省东北师范大学附属中学2015届高三理科高考总复习阶段测试卷 理数
吉林省东北师范大学附属中学2015届高三理科高考总复习阶段测试卷 理数_高中教育_...为. 14.如图,已知底面半径为 r 的圆柱被一个平面所截,剩下部分的母线长的...
吉林省东北师范大学附属中学2015届高三文科数学一轮复习:轨迹与轨迹方程2
吉林省东北师范大学附属中学2015届高三文科数学一轮复习:轨迹与轨迹方程2_数学_高中...“坐标化”将其转化为寻求变量间的关系问题,解决这类 问题不但对圆锥曲线的...
吉林省东北师范大学附属中学2015届高考
吉林省东北师范大学附属中学2015届高考_高三数学_数学...考点一 集合间的关系及运算 例1 (1)(2012· ...千万别忽视了改变量 词;另外,要注意一些量词的否定...
吉林省东北师范大学附属中学2016届高三上学期第二次模拟考试文数试题 Word版含解析
吉林省东北师范大学附属中学2016届高三上学期第二次模拟考试文数试题 Word版含解析_高三数学_数学_高中教育_教育专区。吉林省东北师范大学附属中学2016届高三上学期第...
更多相关标签:

相关文章