当前位置:首页 >> 高三数学 >>

1、1回归分析的基本思想及其初步应用


新课标

数 学

选修 1-2

1.1

回归分析的基本思想及其初步应用

(教师用书独具) ●三维目标 1.知识与技能 通过典型案例的探究, 了解回归分析的基本思想,会对两个变量进行回归分 析, 明确解决回归模型的基本步骤,并对具体问题进行回归分析以解决实际应用 问题.了解最小二乘法的推导,解释残差变量的含义,了解偏差平方和分解的思 想, 了解判断刻画模型拟合效果的方法——相关指数和残差分析.掌握利用计算 器求线性回归直线方程参数及相关系数的方法. 2.过程与方法 通过收集数据作散点图,分析散点图,求回归直线方程,分析回归效果,利 用方程进行预报. 3.情感、态度与价值观 培养学生利用整体的观点和互相联系的观点来分析问题, 进一步加强数学 的应用意识,培养学生学好数学、用好数学的信心,加强与现实生活的联系,以 科学的态度评价两个变量的相互关系. ●重点难点 重点:回归分析的基本方法、随机误差 e 的认识、残差图的概念、用残差及 R2 来刻画线性回归模型的拟合效果. 难点:回归分析的基本方法、残差概念的理解及拟合效果的判定、非线性回

归向线性回归的转化. 教学时要以残差分析为重点,突出残差表和 R2 的计算,通过举例说明相关 关系与确定性关系的区别, 说明回归分析的必要性及其方法.借助例题使学生掌 握作散点图、求回归直线方程的方法,通过作残差图、计算 R2 让学生掌握拟合 效果的判断方法. 对于非线性回归问题重点在如何转换,引导学生分析总结转化 方法和技巧,从而化解难点.

(教师用书独具)

●教学建议 本节课建议教师采取探究式教学,把“关注知识”转向“关注学生”,在教 学过程中, 把“给出知识”的过程转变为“引起活动, 让学生探究知识的过程”, 把“完成教学任务”转向“促进学生发展”,让学生成为课堂上的真正主人.在 教学中, 知识点可由学生通过探索“发现”, 让学生充分经历探索与发现的过程, 并引导学生积极解决探索过程中发现的问题.教学中不要以练习为主,而是定位 在知识形成过程的探索,例题的解答也要由学生探讨、教师点拨,共同完成.要 注重数学的思想性, 如统计思想、 随机观念、 函数思想、 数形结合的思想方法等, 引导学生体验数学中的理性精神,加强数学形式下的思考和推理能力. ●教学流程 创设问题情境,引出问题,引导学生探讨,从而引出回归分析、线性回归模 型、刻画回归效果的有关概念及解决方法. 利用填一填的形式,使学生自主学 习本节基础知识,并反馈了解,对理解有困难的概念加以讲解. 引导学生在学 习基础知识的基础上分析回答例题 1 的问题, 并总结规律方法, 完成变式训练. 引导学生分析例题 2,根据图中的数据计算系数,求出回归方程,列出残差表, 求出 R2 并判断拟合效果,完成变式训练.

完成当堂双基达标,巩固所学知识及应用方法,并进行反馈矫正. 归纳整 理,进行课堂小结,整体认识本节所学知识,强调重点内容和规律方法. 通过 老师启发引导,完成例题 3,并要求学生借鉴例题 3 的解法完成变式训练. 引 导学生分析例题 3,让学生作出散点图,观察相关性,引出问题,即如何使问题 转化为相关关系并用线性回归分析二者关系.

1.会用散点图分析两个变量是否存在相关关系.(重点) 课标解读 2.会求回归方程,掌握建立回归模型的步骤,会选择回归模 型.(重点、难点)

线性回归模型 【问题导思】 一台机器由于使用时间较长,生产的零件有一些会有缺陷.按不同转速生 产出有缺陷的零件的统计数据如下:

转速 x(转/秒) 每小时生产有缺 陷的零件数 y(件) 1.在平面直角坐标系中作出散点图. 【提示】

16 11

14 9

12 8

8 5

2.从散点图中判断 x 和 y 之间是否具有相关关系? 【提示】 有.

3.若转速为 10 转/秒,能否预测机器每小时生产缺陷的零件件数? 【提示】 可以.根据散点图作出一条直线,求出直线方程后可预测.

^ ^ ^ (1)回归直线方程: y=bx+a,其中:

^= b

i=1

? ?xi- x ??yi- y ? ? ?xi- x ?2
n

n

^= y -b ^ x , x =1 n x , ,a i ni? =1

i=1

1n y =n ?yi. i=1 (2)变量样本点中心:( x , y ),回归直线过样本点的中心. (3)线性回归模型:y=bx+a+e,其中 e 称为随机误差,a 和 b 是模型的未 知参数,自变量 x 称为解释变量,因变量 y 称为预报变量.

刻画回归效果的方式

残差

对于样本点(xi,yi)(i=1,2,?,n)的随机误差的估计值^ ei=yi-^ y i, 称为相应于点(xi,yi)的残差 利用图形来分析残差特性,作图时纵坐标为残差,横坐标可以选

残差图

为样本编号,或身高数据,或体重估计值等,这样作出的图形称 为残差图

残差 图法 残差平 方和

残差点比较均匀地落在水平的带状区域内,说明选用的模型比较 适合,这样的带状区域的宽度越窄,说明模型拟合精度越高
n 残差平方和为 ? (yi-^ yi)2,残差平方和越小,模型拟合效果越好 i=1

i=1

yi?2 ? ?yi-^
n

n

相关指 数R
2

R =1-

2

,R2 表示解释变量对预报变量变化的贡献率,

i=1

? ?yi- y ?2
R2 越接近于 1,表示回归的效果越好

回归分析的有关概念 有下列说法: ①线性回归分析就是由样本点去寻找一条直线, 使之贴近这些样本点的数学 方法; ②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系 ^x+a ^,可以估计和观测变量的取值和变化趋势;④因 表示;③通过回归方程^ y=b 为由任何一组观测值都可以求得一个线性回归方程, 所以没有必要进行相关性检 验. 其中正确命题的个数是( A.1 【思路探究】 B.2 ) C.3 D.4

可借助于线性相关概念及性质逐一作出判断.

【自主解答】 ①反映的正是最小二乘法思想,故正确.②反映的是画散点 ^x+a ^的作用,故也正确.④是不正 图的作用,也正确.③解释的是回归方程^ y=b 确的,在求回归方程之前必须进行相关性检验,以体现两变量的关系. 【答案】 C

1.解答例 1 中④时,必须明确具有线性相关关系的两个变量间才能求得一 个线性回归方程, 否则求得的方程无实际意义. 因此必须先进行线性相关性判断, 后求线性回归方程. 2.回归分析的过程: (1)随机抽取样本,确定数据,形成样本点; (2)由样本点形成散点图,判断是否具有线性相关关系; (3)由最小二乘法确定线性回归方程; (4)由回归方程观察变量的取值及变化趋势.

关于变量 y 与 x 之间的回归直线方程叙述正确的是( A.表示 y 与 x 之间的一种确定性关系

)

B.表示 y 与 x 之间的相关关系 C.表示 y 与 x 之间的最真实的关系 D.表示 y 与 x 之间真实关系的一种效果最好的拟合 【解析】 回归直线方程能最大可能地反映 y 与 x 之间的真实关系,故选项 D 正确. 【答案】 D 线性回归分析 已知某种商品的价格 x(元)与需求量 y(件)之间的关系有如下一组数 据: x y 14 12 16 10 18 7 20 5 22 3

求 y 关于 x 的回归直线方程,并说明回归模型拟合效果的好坏. 【思路探究】 回归模型拟合效果的好坏可以通过计算 R2 来判断,其值越

大,说明模型的拟合效果越好. 【自主解答】 1 x =5(14+16+18+20+22)=18,

1 y =5(12+10+7+5+3)=7.4,
2 2 2 2 2 ?x2 i =14 +16 +18 +20 +22 =1 660, 5

i=1

i=1

?xiyi=14×12+16×10+18×7+20×5+22×3=620,
5

5

^ 所以b=

i =1

?xiyi-5 x
2 ?x2 i -5 x 5

y = 620-5×18×7.4 =-1.15, 1 660-5×182

i=1

^=7.4+1.15×18=28.1, a 所以所求回归直线方程是^ y=-1.15x+28.1.列出残差表: yi-^ yi 0 0.3 -0.4 -0.1 0.2

yi- y

4.6

2.6

-0.4

-2.4

-4.4

5 5 所以 ? (yi-^ yi)2=0.3, ? (yi- y )2=53.2, i=1 i=1

i =1

yi?2 ? ?yi-^
5

5

R =1-

2

≈0.994,
2

i =1

? ?yi- y ?

所以回归模型的拟合效果很好.

^ ^ 1.回归直线方程能定量地描述两个变量的关系,系数a,b刻画了两个变量 ^表示 x 变化一个单位时,y 的平均变化量.利用回归直 之间的变化趋势,其中b 线可以对问题进行预测,由一个变量的变化去推测另一个变量的变化. 2.线性回归分析中: (1)残差平方和越小,预报精确度越高. (2)相关指数 R2 取值越大,说明模型的拟合效果越好.

某运动员训练次数与运动成绩之间的数据关系如下: 次数(x) 成绩(y) (1)作出散点图; (2)求出线性回归方程; (3)作出残差图,并说明模型的拟合效果; (4)计算 R2,并说明其含义. 【解】 (1)作出该运动员训练次数(x)与成绩(y)之间的散点图,如图所示. 30 30 33 34 35 37 37 39 39 42 44 46 46 48 50 51

(2)可求得 x =39.25, y =40.875, ?x2 i =12 656,
i=1

8

i=1

?y2 i =13 731, ?xiyi=13 180,
i=1 8

8

8

^= ∴b

i=1

? ?xi- x ??yi- y ? ? ?xi- x ?2
8

i=1

i=1

?xiyi-8 x
x2 i -8 i=1

8

y ≈1.041 5,



?

8

x

2

^= y -b ^ x =-0.003 875, a ∴线性回归方程为^ y=1.041 5x-0.003 875. (3)作残差图如图所示,

由图可知, 残差点比较均匀地分布在水平带状区域中,说明选用的模型比较 合适. (4)相关指数 R2=0.985 5.说明了该运动员的成绩的差异有 98.55%的可能性 是由训练次数引起的. 非线性回归分析 下表为收集到的一组数据: x y 21 7 23 11 25 21 27 24 29 66 32 115 35 325

(1)作出 x 与 y 的散点图,并猜测 x 与 y 之间的关系; (2)建立 x 与 y 的关系,预报回归模型并计算残差;

(3)利用所得模型,预报 x=40 时 y 的值. 【思路探究】 (1)画出散点图或进行相关性检验,确定两变量 x、y 是否线

性相关.由散点图得 x、y 之间的回归模型. (2)进行拟合,预报回归模型,求回归方程. 【自主解答】 (1)作出散点图如图, 从散点图可以看出 x 与 y 不具有线性相 关关系,根据已有知识可以发现样本点分布在某一条指数函数曲线 y=c1ec2x 的 周围,其中 c1、c2 为待定的参数.

(2)对两边取对数把指数关系变为线性关系,令 z=ln y,则有变换后的样本 点应分布在直线 z=bx+a,a=ln c1,b=c2 的周围,这样就可以利用线性回归模 型来建立 y 与 x 之间的非线性回归方程了,数据可以转化为:

x z

21 1.946

23 2.398

25 3.045

27 3.178

29 4.190

32 4.745

35 5.784

求得回归直线方程为^ z =0.272x-3.849, ∴^ y=e0.272x-3.849. 残差如下表:

yi ^ yi ^ ei

7 6.443 0.557

11 11.101 -0.101

21 19.125 1.875

24 32.950 -8.950

66 56.770 9.23

115 128.381 -13.381

325 290.325 34.675

(3)当 x=40 时,y=e0.272x-3.849≈1 131.

两个变量不具有线性关系, 不能直接利用线性回归方程建立两个变量的关 系,可以通过变换的方法转化为线性回归模型,如 y=c1ec2x,我们可以通过对 数变换把指数关系变为线性关系,令 z=ln y,则变换后样本点应该分布在直线 z

=bx+a(a=ln c1,b=c2)的周围.

有一个测量水流量的实验装置,测得试验数据如下表: i 水高 h(厘米) 流量 Q(升/分钟) 0.082 0.25 1.8 11.2 37.5 66.5 134 1 0.7 2 1.1 3 2.5 4 4.9 5 8.1 6 10.2 7 13.5

根据表中数据,建立 Q 与 h 之间的回归方程. 【解】 由表中测得的数据可以作出散点图,如图.

观察散点图中样本点的分布规律,可以判断样本点分布在某一条曲线附近, 表示该曲线的函数模型是 Q=m· hn(m,n 是正的常数).两边取常用对数, 则 lg Q=lg m+n· lg h. 令 y=lg Q,x=lg h,那么 y=nx+lg m, 即为线性函数模型 y=bx+a 的形式(其中 b=n,a=lg m). ^ ≈2.509 7 , a ^ =- 0.707 7 ,所以 由下面的数据表,用最小二乘法可求得 b n≈2.51,m≈0.196. i 1 2 3 4 5 6 7 ∑ hi 0.7 1.1 2.5 4.9 8.1 10.2 13.5 Qi 0.082 0.25 1.8 11.2 37.5 66.5 134 xi=lg hi -0.154 9 0.041 4 0.397 9 0.690 2 0.908 5 1.008 6 1.130 3 4.022 yi=lg Qi -1.086 2 -0.602 1 0.255 3 1.049 2 1.574 0 1.822 8 2.127 1 5.140 1 xi2 0.024 0.001 7 0.158 3 0.476 4 0.825 4 1.017 3 1.277 6 3.780 7 xiyi 0.168 3 -0.024 9 0.101 6 0.724 2 1.430 0 1.838 5 2.404 3 6.642

于是所求得的回归方程为 Q=0.196· h2.51.

没有理解相关指数 R2 的意义而致误 关于 x 与 y 有如下数据:

x y

2 30

4 40

5 60

6 50

8 70

为了对 x、 y 两个变量进行统计分析, 现有以下两种线性模型: 甲模型^ y=6.5x +17.5,乙模型^ y=7x+17,试比较哪一个模型拟合的效果更好. yi?2 ? ?yi-^
5 5

i=1

【错解】

∵R2 1=1-

i=1

? ?yi- y ?2

155 =1-1 000=0.845.

i =1

yi?2 ? ?yi-^
5

5

R2 2=1-

i =1

? ?yi- y ?2

180 =1-1 000=0.82.

又∵84.5%>82%,∴乙选用的模型拟合的效果更好. 【错因分析】 没有理解 R2 的意义是致错的根源,用相关指数 R2 来比较模 型的拟合效果,R2 越大,模型的拟合效果越好,并不是 R2 越小拟合效果更好. yi?2 ? ?yi-^
n n

i=1

【防范措施】 R2=1-

,R2 越大,残差平方和越小,从而回归

i=1

? ?yi- y ?2

模型的拟合效果越好.在线性回归模型中,R2 表示解释变量对于预报变量变化 的贡献率,R2 越接近 1,表示回归的效果越好(因为 R2 越接近 1,表示解释变量 和预报变量的线性相关性越强).从根本上理解 R2 的意义和作用,就可防止此类 错误的出现.

i=1

yi?2 ? ?yi-^
5

5

【正解】

R2 1=1-

i=1

? ?yi- y ?2

155 =1-1 000=0.845,

i =1

yi?2 ? ?yi-^
5

5

R2 2=1-

i =1

? ?yi- y ?2

180 =1-1 000=0.82,

84.5%>82%,所以甲模型拟合效果更好.

1.在研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线 性相关,是否可以用线性回归模型来拟合数据.然后,可以通过残差^ e1,^ e2,?, ^ en 来判断模型拟合的效果,判断原始数据中是否存在可疑数据.这方面的分析工 作称为残差分析. 2.我们还可以用相关指数 R2 来反映回归的效果,其计算公式是:R2=1-

i=1 n

yi?2 ? ?yi-^ .

n

i=1

? ?yi- y ?2

显然,R2 取值越大,意味着残差平方和越小,也就是说模型的拟合效果越好.在 线性回归模型中,R2 表示解释变量对于预报变量变化的贡献率.

1.已知 x 和 y 之间的一组数据

x y

0 1

1 3

2 5

3 7 )

^x+a ^必过点( 则 y 与 x 的线性回归方程^ y=b A.(2,2) C.(1,2) 【解析】 3 B.(2,0)

3 D.(2,4) 1 3 1 ∵ x =4(0+1+2+3)=2, y =4(1+3+5+7)=4,

^x+a ^必过点(3,4). ∴回归方程^ y=b 2 【答案】 D

2.(2013· 青岛高二检测)在下列各组量中:①正方体的体积与棱长;②一块 农田的水稻产量与施肥量;③人的身高与年龄;④家庭的支出与收入;⑤某户家 庭的用电量与电价.其中量与量之间的关系是相关关系的是( A.①② ) C .③④

B .②④ D.②③④

【解析】 ①是函数关系 V=a3;⑤电价是统一规定的,与用电量有一定的 关系,但这种关系是确定的关系.②③④中的两个量之间的关系都是相关关系, 因为水稻的产量与施肥量在一定范围内是正比、反比或其他关系,并不确定;人

的身高一开始随着年龄的增加而增大,之后则不变化或降低,在身高增大时,也 不是均匀增大的;家庭的支出与收入有一定的关系,在一开始,会随着收入的增 加而支出也增加,而当收入增大到一定的值后,家庭支出趋向于一个常数值,也 不是确定关系. 【答案】 D

3.下列命题正确的有________. ①在线性回归模型中,e 是 bx+a 预报真实值 y 的随机误差,它是一个可观 测的量; ②残差平方和越小的模型,拟合的效果越好; ③用 R2 来刻画回归方程,R2 越小,拟合的效果越好; ④在残差图中, 残差点比较均匀地落在水平的带状区域中,说明选用的模型 比较合适, 若带状区域宽度越窄, 说明拟合精度越高, 回归方程的预报精度越高. 【解析】 对于①随机误差 e 是一个不可观测的量,③R2 越趋于 1,拟合效 果越好,故①③错误.对于②残差平方和越小,拟合效果越好,同理当残差点比 较均匀地落在水平的带状区域时,拟合效果越好,故②④正确. 【答案】 ②④

4. 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量 x(吨) 与相应的生产能耗 y(吨标准煤)的几组对照数据:

x y

3 2.5

4 3

5 4

6 4.5

(1)请画出上表数据的散点图; (2)请根据上表提供的数据,用最小二乘法求出 y 关于 x 的线性回归方程; (3)已知该厂技改前 100 吨甲产品的生产能耗为 90 吨标准煤. 试根据(2)求出 的线性回归方程,预测技改后生产 100 吨甲产品比技改前少消耗多少吨标准煤. (参考数值:3×2.5+4×3+5×4+6×4.5=66.5) 【解】 (1)如下图.

(2) ?xiyi=3×2.5+4×3+5×4+6×4.5=66.5,
i=1

4

x=
4

3+4+5+6 2.5+3+4+4.5 = 4.5 , y = =3.5, 4 4

i=1

2 2 2 2 ?x2 i =3 +4 +5 +6 =86.

^=66.5-4×4.5×3.5=66.5-63=0.7, b 86-4×4.52 86-81 ^= y -b ^ x =3.5-0.7×4.5=0.35, a 因此,所求的线性回归方程为^ y=0.7x+0.35. (3)根据回归方程预测,现在生产 100 吨产品消耗的标准煤的数量为 0.7×100+ 0.35 = 70.35( 吨 ) , 故 耗 能 减 少 了 煤 90 - 70.35 = 19.65( 吨 标 准 ).

一、选择题 1.在画两个变量的散点图时,下面叙述正确的是( A.预报变量在 x 轴上,解释变量在 y 轴上 B.解释变量在 x 轴上,预报变量在 y 轴上 C.可以选择两个变量中任意一个变量在 x 轴上 D.可以选择两个变量中任意一个变量在 y 轴上 【解析】 结合线性回归模型 y=bx+a+e 可知,解释变量在 x 轴上,预报 变量在 y 轴上,故选 B. 【答案】 B )

2.(2013· 泰安高二检测)在回归分析中,相关指数 R2 的值越大,说明残差平

方和(

) B.越小 D.以上均错 yi?2 ? ?yi-^
n n

A.越大 C.可能大也可能小

i=1

【解析】

∵R2=1-

,∴当 R2 越大时,

i=1

? ?yi- y ?2

i=1

yi)2 越小,即残差平方和越小. ? (yi-^ B

n

【答案】

3. 设变量 y 对 x 的线性回归方程为^ y=2-2.5x, 则变量 x 每增加一个单位时, y 平均( ) B.增加 2 个单位 D.减少 2 个单位

A.增加 2.5 个单位 C.减少 2.5 个单位 【解析】 2.5 个单位. 【答案】 C

^=-2.5,表示 x 每增加一个单位,y 平均减少 回归直线的斜率b

4.(2012· 湖南高考)设某大学的女生体重 y(单位:kg)与身高 x(单位:cm)具 有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,?,n),用最小二乘法建立 的回归方程为^ y=0.85x-85.71,则下列结论中不正确 的是( ... A.y 与 x 具有正的线性相关关系 B.回归直线过样本点的中心( x , y ) C.若该大学某女生身高增加 1 cm,则其体重约增加 0.85 kg D.若该大学某女生身高为 170 cm,则可断定其体重必为 58.79 kg 【解析】 由于线性回归方程中 x 的系数为 0.85,因此 y 与 x 具有正的线性 相关关系, 故 A 正确. 又线性回归方程必过样本中心点( x ,y ), 因此 B 正确. 由 线性回归方程中系数的意义知,x 每增加 1 cm,其体重约增加 0.85 kg,故 C 正 确.当某女生的身高为 170 cm 时,其体重估计值是 58.79 kg,而不是具体值, )

因此 D 不正确. 【答案】 D

5.在判断两个变量 y 与 x 是否相关时,选择了 4 个不同的模型,它们的相 关指数 R2 分别为:模型 1 的相关指数 R2 为 0.98,模型 2 的相关指数 R2 为 0.80, 模型 3 的相关指数 R2 为 0.50, 模型 4 的相关指数 R2 为 0.25.其中拟合效果最好的 模型是( ) B.模型 2 D.模型 4 相关指数 R2 能够刻画用回归模型拟合数据的效果,相关指数 R2

A.模型 1 C.模型 3 【解析】

的值越接近于 1,说明回归模型拟合数据的效果越好. 【答案】 二、填空题 6.在研究身高和体重的关系时,求得相关指数 R2≈________,可以叙述为 “身高解释了 64%的体重变化,而随机误差贡献了剩余的 36%”,所以身高对 体重的效应比随机误差的效应大得多. yi?2 ? ?yi-^
n n

A

i=1

【解析】 结合相关指数的计算公式 R =1-

2

可知,当 R2=0.64

i=1

? ?yi- y ?2

时,身高解释了 64%的体重变化. 【答案】 0.64

7.调查了某地若干户家庭的年收入 x(单位:万元)和年饮食支出 y(单位:万 元),调查显示年收入 x 与年饮食支出 y 具有线性相关关系,并由调查数据得到 y 对 x 的回归直线方程:^ y=0.254x+0.321.由回归直线方程可知,家庭年收入每增 加 1 万元,年饮食支出平均增加________万元. 【解析】 以 x+1 代 x,得^ y=0.254(x+1)+0.321,与^ y=0.254x+0.321 相

减可得,年饮食支出平均增加 0.254 万元. 【答案】 0.254

8.已知回归直线的斜率的估计值为 1.23,样本点的中心为(4,5),则回归直

线方程是________. 【解析】 由斜率的估计值为 1.23, 且回归直线一定经过样本点的中心(4,5), 可得^ y-5=1.23(x-4), 即^ y=1.23x+0.08. 【答案】 三、解答题 9. 某省 2013 年的阅卷现场有一位质检老师随机抽取 5 名学生的总成绩和数 学成绩(单位:分)如下表所示: ^ y=1.23x+0.08

学生 总成绩(x) 数学成绩(y) (1)作出散点图; (2)对 x 与 y 作回归分析;

A 482 78

B 383 65

C 421 71

D 364 64

E 362 61

(3)求数学成绩 y 对总成绩 x 的回归直线方程; (4)如果一个学生的总成绩为 500 分,试预测这个学生的数学成绩. 【解】 (1)散点图如图所示:

2 012 339 5 (2) x = 5 , y = 5 ,∑i=1x2 i =819 794, ∑i=1yi2=23 167,∑i=1xiyi=137 760. ∴r=错误! · 错误!)=错误!≈0.989. 因此可以认为 y 与 x 有很强的线性相关关系. ^= (3)回归系数b ∑i=1xiyi-5 x ∑i=1x2 i -5 x
5 2 5 5 5

y

=0.132 452,

^= y -b ^ x =14.501 315. a ∴回归方程为^ y=0.132 452x+14.501 315. (4)当 x=500 时,^ y≈81.即当一个学生的总成绩为 500 分时,他的数学成绩 约为 81 分. 10.(2012· 福建高考)某工厂为了对新研发的一种产品进行合理定价,将该产 品按事先拟定的价格进行试销,得到如下数据:

单价 x(元) 销量 y(件)

8 90

8.2 84

8.4 83

8.6 80

8.8 75

9 68

(1)求回归直线方程^ y=bx+a,其中 b=-20,a= y -b x ; (2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成 本是 4 元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销 售收入-成本) 【解】 1 (1)由于 x =6(8+8.2+8.4+8.6+8.8+9)=8.5,

1 y =6(90+84+83+80+75+68)=80,又 b=-20, 所以 a= y -b x =80+20×8.5=250, 从而回归直线方程为^ y=-20x+250. (2)设工厂获得的利润为 L 元,依题意得 L=x(-20x+250)-4(-20x+250) =-20x2+330x-1 000 =-20(x-8.25)2+361.25. 当且仅当 x=8.25 时,L 取得最大值. 故当单价定为 8.25 元时,工厂可获得最大利润. 11.在关于人的脂肪含量(百分比)和年龄的关系的研究中,研究人员获得了 一组数据如下表:

年 龄

23

27

39

41

45

49

50

53

54

56

57

58

60

61

x 脂 肪 含 量 y (1)作出散点图,并判断 y 与 x 是否线性相关.若线性相关,求线性回归方 程; (2)求相关指数 R2,并说明其含义; (3)给出 37 岁时人的脂肪含量的预测值. 【解】 (1)散点图如图所示.由散点图可知样本点呈条状分布,脂肪含量 9.5 17. 8 21. 2 25. 9 27. 5 26. 3 28. 2 29. 6 30. 2 31. 4 30. 8 33. 5 35. 2 34. 6

与年龄有比较好的线性相关关系, 因此可以用线性回归方程来刻画它们之间的关 系.

^x+a ^, 设线性回归方程为^ y=b ^≈0.576,a ^≈=-0.448, 则由计算器算得b 所以线性回归方程为^ y=0.576x-0.448.
14 14 ^ 2 (2)残差平方和: ? ^ e2 i = ? (yi-yi) ≈37.78. i=1 i=1

14 总偏差平方和: ? (yi-- y )2≈644.99. i=1

37.78 R2=1-644.99≈0.941. R2≈0.941,表明年龄解释了 94.1%的脂肪含量变化.

^ (3) 当 x = 37 时, y = 0.576×37 - 0.448≈20.9 ,故 37 岁时人的脂肪含量约为 20.9%.

(教师用书独具)

为研究重量 x(单位:克)对弹簧长度 y(单位:厘米)的影响,对不同重量的 6 个物体进行测量,数据如下表所示:

x y

5 7.25

10 8.12

15 8.95

20 9.90

25 10.9

30 11.8

(1)作出散点图并求回归方程; (2)求出 R2; (3)进行残差分析. 【思路探究】 (1)由表作出散点图,求出系数值,即可写出回归方程.

(2)列出残差表,计算 R2,由 R2 的值判断拟合效果. (3)由(2)中残差表中数值,进行回归分析. 【自主解答】 (1)散点图如图.

1 x =6(5+10+15+20+25+30)=17.5, 1 y =6(7.25+8.12+8.95+9.90+10.9+11.8) ≈9.487,

i=1

?x2 i =2 275, ?xiyi=1 076.2.
i=1

6

6

^≈0.183,a ^≈6.285, 计算得,b 所求线性回归方程为^ y=6.285+0.183x. (2)列表如下:

yi-^ yi yi- y

0.05 -2.24

0.005 -1.37

-0.08 -0.54

-0.045 0.41

0.04 1.41

0.025 2.31

6 6 所以 ? (yi-^ yi)2≈0.013 18, ? (yi- y )2=14.678 4. i=1 i =1

0.013 18 所以,R2=1-14.678 4≈0.999 1,回归模型的拟合效果较好. (3)由残差表中的数值可以看出第 3 个样本点的残差比较大,需要确认在采 集这个数据的时候是否有人为的错误,如果有的话,需要纠正数据,重新建立回 归模型;由表中数据可以看出残差点比较均匀地落在不超过 0.15 的狭窄的水平 带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度 与拉力成线性关系.

建立回归模型的基本步骤: (1)确定解释变量和预报变量; (2)画散点图,观察是否存在线性相关关系; (3)确定回归方程的类型,如 y=bx+a; (4)按最小二乘法估计回归方程中的参数; (5)得结果后分析残差图是否异常,若存在异常,则检查数据是否有误,或 模型是否合适.

假设关于某设备的使用年限 x(年)和所支出的维修费用 y(万元)有关的统计 资料如下表所示.

使用年限 x 维修费用 y

2 2.2

3 3.8

4 5.5

5 6.5

6 7.0

若由资料知 y 对 x 呈线性相关关系.试求: ^x+a ^的回归系数a ^、b ^; (1)线性回归方程^ y=b (2)求相关指数 R2; (3)估计使用年限为 10 年时,维修费用是多少? 【解】 (1)由已知数据制成下表.

i xi yi

1 2 2.2

2 3 3.8

3 4 5.5

4 5 6.5

5 6 7.0

合计 20 25

由此可得 x =4, y =5,

^= b

i=1

? ?xi- x ??yi- y ? ? ?xi- x ?2
5

5

=1.23,

i=1

^= y -b ^ x =5-1.23×4=0.08, a ∴^ y=1.23x+0.08. yi?2 ? ?yi-^
5 5

i=1

(2)R2=1-

i=1

? ?yi- y ?2

0.651 =1-15.78≈0.958 7. (3)回归直线方程为^ y=1.23x+0.08,当 x=10(年)时,^ y =1.23×10+0.08= 12.38(万元),

即估计使用 10 年时维修费用是 12.38 万元.


相关文章:
1.1《回归分析的基本思想及其初步应用》(1课时)_图文.ppt
1.1《回归分析的基本思想及其初步应用》(1课时) - 第一章 统计案例 数学3
《1.1回归分析的基本思想及其初步应用》ppt课件6_图文.ppt
《1.1回归分析的基本思想及其初步应用》ppt课件6_数学_高中教育_教育专区。高二数学 选修1-2 1.1回归分析的基 本思想及其初步 应用 2015/11/12 郑平正 制作 ...
选修1-2_1.1回归分析的基本思想及其初步应用.ppt
选修1-2_1.1回归分析的基本思想及其初步应用_高二数学_数学_高中教育_教育
高中数学选修1-2_1.1回归分析的基本思想及其初步应用.ppt
高中数学选修1-2_1.1回归分析的基本思想及其初步应用_高二数学_数学_高中教
1.1回归分析的基本思想及其初步应用(优质课)_图文.ppt
1.1回归分析的基本思想及其初步应用(优质课) - 普通高中课程标准实验教科书
《1.1回归分析的基本思想及其初步应用》ppt课件_图文.ppt
《1.1回归分析的基本思想及其初步应用》ppt课件 - 1.1 回归分析的基本思想及其初步应用 【课标要求】 1.了解随机误差、残差、残差分析的概念; 2.会用残差分析...
1、1回归分析的基本思想及其初步应用.doc
1、1回归分析的基本思想及其初步应用 - 新课标 数学 选修 1-2 1.1 回归分析的基本思想及其初步应用 (教师用书独具) ●三维目标 1.知识与技能 通过典型案例的...
1.1回归分析的基本思想及其初步应用 教学设计 教案.doc
1.1回归分析的基本思想及其初步应用 教学设计 教案 - 教学准备 1. 教学目
1.1.1(1)回归分析的基本思想及其初步应用(一).doc
1.1.1(1)回归分析的基本思想及其初步应用(一) - (文) § 1.1.1 回归分析的基本思想及 其初步应用(一) 【学习目标】 1. 通过典型案例的探究,进一步了解...
1.1回归分析的基本思想及其初步应用导学案及答案.doc
1.1回归分析的基本思想及其初步应用导学案及答案 - 第04课时 1.1.4 回
1.1回归分析的基本思想及其初步应用(1)_图文.ppt
1.1回归分析的基本思想及其初步应用(1) - 1.1回归分析的基本思想及其 初步应用 第1课时 现实生活中两个变量间的关系: 不相关 两个变量的关系 函数关系 线性...
《1.1回归分析的基本思想及其初步应用》(优秀)_图文.ppt
《1.1回归分析的基本思想及其初步应用》(优秀) - 高二数学 选修1-2 1.1回归分析的基 本思想及其初步 应用 2018/5/31 郑平正 制作 比《数学3》中“回归”...
1.1回归分析的基本思想及其初步应用_图文.ppt
1.1回归分析的基本思想及其初步应用 - 1.1回归分析的基本 思想及其初步应用 数学必修3第二章 统计 2.1 2.2 2.3 随机抽样 用样本估计总体 变量间的...
1.1回归分析的基本思想及其初步应用_图文.ppt
1.1回归分析的基本思想及其初步应用 - 函数关系是一种确定性关系 相关关系是一
1.1回归分析的基本思想及其初步应用(1)_图文.ppt
1.1回归分析的基本思想及其初步应用(1) - 1.1回归分析的基本 思想及其初步应用 必修3(第二章 统计)知识结构 收集数据 (随机抽样) 整理、分析数据估 计、推断...
1.1《回归分析的基本思想及其初步应用》课件_图文.ppt
1.1《回归分析的基本思想及其初步应用》课件_理学_高等教育_教育专区。01【数学】1.1《回归分析的基本思想及其初步应用》课件(新人教A版选修1-2) ...
1.1回归分析的基本思想及其初步应用(4)_图文.ppt
1.1回归分析的基本思想及其初步应用(4) - 1.1 回归分析的基本思想 及其初步应用 第四课时 靖远一中 陈永长 复习回顾 1、线性回归模型:y=bx+a+e, 其中a和...
《1.1回归分析的基本思想及其初步应用》2_图文.ppt
《1.1回归分析的基本思想及其初步应用》2 - 高二数学 选修1-2 1.1回归分析的基 本思想及其初步 应用 2018/5/14 郑平正 制作 复习、变量之间的两种关系 问题...
1.1回归分析的基本思想及其初步应用(3)_图文.ppt
1.1回归分析的基本思想及其初步应用(3) - 非线性回归问题 案例2 一只红铃
1.1回归分析的基本思想及其初步应用第2课时.doc
1.1回归分析的基本思想及其初步应用第2课时 - 巴东一中高二年级数学组 §1.
更多相关标签: