当前位置:首页 >> 数学 >>

第2讲 变量的相关性


变量的相关性

1.变量间的相关关系 (1)散点图 将样本中 n 个数据点xi,yi)(i=1,2,…,n)描在平面直角坐标 系中,表示两个变量关系的一组数据的图形叫做散点图. (2)正相关、负相关 ①散点图中各点散布的位置是从左下角到右上角的区域,即 一个变量的值由小变大时,另一个变量的值也由小变大,这种关 系称为_______;

②散点图中各点散布的位置是从左上角到右下角的区域,即

一个变量的值由小变大时,另一个变量的值却由大变小,这种关
系称为________. 2.两个变量的线性相关

(1)线性相关关系
观察散点图的特征,如果散点图中点的分布从整体上看大致

在一条直线附近,我们就称这两个变量之间具有线性相关关系,
这条直线叫做回归直线.

(2)回归直线的求法 设具有线性相关关系的两个变量 x, 的一组观察值为(xi, i)(i y y ^ ^ ^ =1,2,…,n),则回归直线方程y=bx+a的系数为:

-=1 其中 x n

,-= y

,(-,-)称作______________. x y

(3)最小二乘法
^ ^ 通过求 Q= ? ( yi-bxi-a)2 的最小值而得到回归直线的方法,
i?1 n

即求回归直线,使得样本数据的点到它的距离的平方和______, 这一方法叫做最小二乘法. (4)线性相关强度的检验

叫做 y 与 x 的相关系数,简称相关系数.

r 具有以下性质:|r|≤1,并且|r|越接近 1,线性相关程度越强;
|r|越接近 0,线性相关程度越弱.r>0 表明两变量正相关,r<0 表 明两变量负相关.当|r|>0.75 时,认为两个变量有很___的线性相关

关系.
(5)相关指数

相关指数 R2=1-

R2 越接近 1,模型的拟合效果

越好.

1.下列两个变量之间的关系哪个不是函数关系(
A.角度和它的余弦值 B.正方形边长和面积 C.正 n 边形的边数和它的内角和 D.人的年龄和身高 2.有关线性回归的说法,不正确的是(

)

A.相关关系的两个变量是非确定关系
B.散点图能直观地反映数据的相关程度 C.回归直线最能代表线性相关的两个变量之间的关系

D.散点图中的点越集中,两个变量的相关性越强

^ ^ ^ ^ 3.回归直线方程的系数a,b 的最小二乘估计a,b ,使函数 ^ ^ Q(a,b)最小,Q 函数指( ^ ^ A. ? ( yi-bxi-a)
i?1 n

) ^ ^ B. ? yi -bxi-a|
i ?1 n

2

^ ^ C.(yi-bxi-a)2

^ ^ D.yi-bxi-a

4.(2011 辽宁)调查某地若干户家庭的年收入 x(单位:万元)

和年饮食支出 y(单位:万元),调查显示年收入 x 与年饮食支出 y
^ 具有线性相关关系,并由调查数据得到 y 对 x 的回归直线方程: y

=0.254x+0.321. 由回归直线方程可知,家庭年收入每增加 1 万元,年饮食支 出平均增加_______万元.

5.(2011 年广东中山三模)已知 x,y 之间的一组数据如下:

x y

0 8

1 2

2 6

3 4

^ ^ ^ 则线性回归方程y=bx+a所表示的直线必经过点_______.

考点1

散点图与相关关系的判断

例1:在 7 块并排、形状大小相同的试验田上进行施化肥量对
水稻产量影响的试验,得到如下表所示的一组数据(单位:kg): 施化肥量 x 15 20 25 30 35 40 45 330 345 365 405 445 450 455

水稻产量

(1)将上述数据制成散点图; (2)你能从散点图中发现施化肥量与水稻产量近似成什么关系 吗?水稻产量会一直随施化肥量的增加而增加吗?

解析:(1)散点图如图D42.

图D42

(2)从图中可以发现数据点大致分布在一条直线的附近,因此
施化肥量和水稻产量近似成线性相关关系,当施化肥量由小变大 时,水稻产量由小变大,但水稻产量只是在一定范围内随着化肥 的施用量的增加而增大.

若在散点图中点的分布有一个集中的大致趋势,

所有点看上去都在一条直线附近波动,就可以说变量间是线性相
关的.且根据散点图还可以判断是正相关还是负相关.

【互动探究】 1.对变量 x,y 有观测数据(xi,yi)(i=1,2,…,10),得散点 图 15-2-5(1);对变量 u,v 有观测数据((ui,vi)(i=1,2,…,10), 得散点图 15-2-5(2). 由这两个散点图可以判断(

)

(1) 图 15-2-5

(2)

A.变量 x 与 y 正相关,u 与 v 正相关 B.变量 x 与 y 正相关,u 与 v 负相关 C.变量 x 与 y 负相关,u 与 v 正相关

D.变量 x 与 y 负相关,u 与 v 负相关
答案:C

考点2 利用回归直线方程对总体进行估计 例2:下表提供了某厂节能降耗技术改造后生产甲产品过程中 记录的产量 x(吨)与相应的生产能耗 y(吨标准煤)的几组对照数据: x 3 4 5 6 y 2.5 3 4 4.5 (1)请画出上表数据的散点图; (2)请根据上表提供的数据,用最小二乘法求出 y 关于 x 的线

^ ^ ^ 性回归方程y=bx+a; (3)已知该厂技改前 100 吨甲产品的生产能耗为 90 吨标准煤.

试根据(2)求出的线性回归方程,预测生产 100 吨甲产品的生产能
耗比技改前降低多少吨标准煤(参考数值:3×2.5+4×3+5×4+ 6×4.5=66.5)?

解题思路:(1)将表中的各对数据在平面直角坐标系中描点, 得到散点图. (2)按要求写出回归方程的步骤和公式,写出回归方程. 解析:(1)图略.
(2) ? xi yi=3×2.5+4×3+5×4+6×4.5=66.5,
i ?1 n

3+4+5+6 x= =4.5, 4 2.5+3+4+4.5 y= =3.5, 4

x i2=32+42+52+62=86. ?
i ?1

n

^=66.5-4×4.5×3.5=66.5-63=0.7, b 86-4×4.52 86-81 ^ ^ a= y -b x =3.5-0.7×4.5=0.35. ^ 故线性回归方程为y=0.7x+0.35.

(3)根据回归方程的预测,现在生产 100 吨产品消耗的标准煤 的数量为:0.7×100+0.35=70.35(吨), 故耗能减少了 90-70.35=19.65(吨).

最小二乘法估计的一般方法: ①作出散点图,判断是否线性相关;
^ ^ ②如果是,则用公式求a ,b ,写出回归方程;

③根据方程进行估计.

【互动探究】 2.为考虑广告费用 x 与销售额 y 之间的关系,抽取了 5 家餐 厅,得到如下数据: 广告费用 x(千元) 销售额 y(千元) 1.0 4.0 6.0 10.0 14.0

19.0 44.0 40.0 52.0 53.0

15 万元 现要使销售额达到 60 万元,则需广告费用为________(保留两
位有效数字).

易错、易混、易漏

^ ^ ^ 25.回归直线方程的记忆学生容易误记为y=ax+b
例题:(2011 江西)为了解儿子身高与其父亲身高的关系,随 机抽取 5 对父子身高数据如下: 父亲身高 x(cm) 174 176 176 176 178

175 175 176 177 177 儿子身高 y(cm) 则 y 对 x 的线性回归方程为( )

^ A.y=x-1 ^=88+1x C.y 2

^ B.y=x+1 ^ D.y=176

^ 正解:方法一:-=176,-=176,∴b= x y

1 ^ - ^- 1 ^=88+1x. =2,a= y -b x =176-2×176=88.故线性回归方程为y 2 方 法 二 : - = 176 , - = 176 , ∴ 本 组 样 本 的 样 本 中 心 为 x y (176,176).根据样本中心一定在回归直线上,把样本中心代入选项 中即可.

答案:C

^ ^ ^ 【失误与防范】实际上y =b x+a 的两个系数学生容易记忆成 ^=b +a x.为防止出现此类错误, y ^ ^ 我们可以通过如下途径求得回归 ^ 直线.由于回归直线必经过样本中心点,通过公式求出系数b ,然 ^ y ^ 后由点斜式写出回归直线y --=b (x--). x

1.相关关系与函数关系不同,函数关系中的两个变量间是一 种确定关系,相关关系是一种非确定性关系,即相关关系是非随

机变量与随机变量之间的关系.两个变量具有相关关系是回归分
析的前提. 2.回归分析是处理变量相关关系的一种数学方法.主要解决: (1)确定特定量之间是否有相关关系,如果有就找出它们之间贴近 的数学表达式;(2)根据一组观察值,预测变量的取值及判断变量 取值的变化趋势;(3)求出回归直线方程.

1.回归分析是对具有相关关系的两个变量进行统计分析的思 想方法,只有散点图大致分布在一条直线附近时,求出的回归直 线方程才有意义.忽视这一条件,求出的直线方程是毫无意义的.
^ ^ 2.求线性回归方程的关键在于正确求出系数a,b,回归直线 ^ ^ 方程中一次项系数为b,常数项为a,它与一次函数的习惯表示不 同,注意不要混淆系数.


相关文章:
2.3 变量的相关性
2.3 变量的相关性_数学_高中教育_教育专区。2.3 变量的相关性 【入门向导】 西方流传的一首民谣 丢失一个钉子,坏了一只蹄铁; 坏了一只蹄铁,折了一匹战马;...
2.3 变量的相关性
2.3 变量的相关性_数学_高中教育_教育专区。2.3 变量的相关性 自主学习 ...叫最小乘法. 对点讲练 知识点一 相关关系的判断 例 1 根据你的生活经验...
第56讲 变量的相关性、统计案例
第56讲 变量的相关性、统计案例_数学_高中教育_教育专区。第 56 讲知识梳理一、变量间的相关关系 变量的相关性、统计案例 Y X x1 x2 总计 y1 y2 总计 a ...
高考风向标文科数学一轮课时知能训练第2讲 变量的相关性
高考风向标文科数学一轮课时知能训练:第 2 讲 关性 变量的相 ^ 1.某工厂某产品产量 x(千件)与单位成本 y(元)满足回归直线方程y=77.36-1.82x,则 以下...
2013高考风向标文科数学一轮课时知能训练:第15章 第2讲 变量的相关性)
2013高考风向标文科数学一轮课时知能训练:第15章 第2讲 变量的相关性)_高中教育_教育专区。2013高考风向标文科数学一轮课时知能训练:第15章 第2讲 变量的相关性...
第2讲 统 计
第2讲 统计 【选题明细表】 知识点、方法 抽样方法 统计图表与数字特征的计算 变量的相关性 概率统计综合问题 一、选择题 1.某校选修乒乓球课程的学生中,高一...
第54讲 变量的相关性、回归分析、独立性检验
2013 年高考第一轮复习资—理科数学 第 60 讲【考点解读】 变量的相关性、回归...(只要求 2× 列联表)的 2 基本思想、方法及初步应用; 2.通过对典型案例(...
第十一章两变量关联性分析实习指导(定)
2 检验。 [案例讨论参考答案] 案例 11-1 Pearson 积差相关在对两定量变量的相关性分析的实 际问题中有广泛的应用, 但在许多情况下, 应用者忽视了 Pearson ...
【步步高】2015届高考数学第一轮知识点巩固题库 第2讲 变量间的相关关系与统计案例(含解析)新人教A版
【步步高】2015届高考数学第一轮知识点巩固题库 第2讲 变量的相关关系与统计...7 (1)请完成上面的列联表; (2)根据列联表的数据,若按 95%的可靠性要求,...
更多相关标签:
spss多变量相关性分析 | 分类变量 相关性分析 | 多变量相关性分析 | 两个变量的相关性分析 | 变量相关性分析 | 多个变量的相关性分析 | 分类变量的相关性分析 | 两变量相关性分析 |