当前位置:首页 >> 其它课程 >>

1.1回归分析的基本思想及其初步应用


1.1 回归分析的基本思想及其初步应用

1.了解随机误差、残差、残差图的概念.

2.会通过分析残差判断线性回归模型的拟合效果.
3.掌握建立回归模型的步骤. 4.了解回归分析的基本思想方法和初步应用.

1.相关关系是一种非确定性关系,__________ 回归分析 是对具有 相关关系的两个变量进行统计

分析的一种常用方法,函数关 系是一种__________ 确定性 关系.

^ 2.在线性回归模型y=bx+a+e中,最小二乘估计 ^ a和b
就是未知参数a和b的最好估计,其计算公式如下:

i=1

- x ??yi- y ? ? ?xi--

n

- 2 ? x - x? ? i ^ b=______________ , i=1 - ^- ^ y -b x a= ______________ ,

n

n n 1 1 其中,- x = ?xi,- y = ?yi. ni=1 ni=1

( x , y ) 称为样本点的中心,回归直线一定过样 另外,________

- -

本点中心.

3.衡量模型拟合效果. (1)残差:对于样本点(x1,y1),(x2,y2),…,(xn,yn)而 言,它们的随机误差为ei=yi-bxi-a,i=1,2,3,…,n,其
^ =y -b ^ x -^ 估计值为 ^ ei=yi-y a,i=1,2,…,n,^ ei 称为相应 i i i

于点(xi,yi)的________ 残差 .

(2)残差图:我们可以利用图形来分析残差特性,作图时
纵坐标为________ 残差 ,横坐标可以选为________ 样本编号,或身高数据, 残差图 或体重估计值等,这样作出的图形称为________ .

残差点比较均匀地落在水平的带状区域中,说明选用的
越窄 ,说明模型 模型比较合适,这样的带状区域的宽度________ 拟合精度越高. (3)残差分析:可以通过残差发现原始数据中的可疑数据, 判断所建立模型的拟合效果.

i=1

^ ? ?yi-yi?2
n

n

1-

2 ? y - y ? ? i (4)相关指数:计算公式是R2=_______________ ,其 i=1



^ 2 ( y y n - ? i) 中残差平方和为___________ ,总偏差平方和为? (yi-- i=1 y )2.
i=1

n

R2越大说明残差平方和________ 越小 ,也就是说模型的拟合效果 贡献率 ,R2 越好 ,R2表示解释变量对预报变量变化的________ ________ 越接近于________ ,表示回归的效果越好. 1

1.重点:通过实际操作进一步理解建立两相关变量的线
性回归模型的思想;求线性回归方程;判断回归模型拟合的 好坏. 2.难点:残差变量的解释与分析及指标R2的理解.

3.知识结构图

4.思维总结 (1)一般情况下,在尚未断定两个变量之间是否具有线性 相关关系的情况下,应先进行相关性检验.在确认其具有线 性相关关系后,再求其回归直线方程;由部分数据得到的回 归直线,可以对两个变量间的线性相关关系进行估计,这实 际上是将非确定性的相关关系问题转化成确定性的函数关系 问题进行研究.由于回归直线将部分观测值所反映的规律性 进行了延伸,它在情况预报、资料补充等方面有着广泛的应 用.

(2)统计的基本思维模式是归纳的,它的特征之一是通过 部分数据来推测全体数据的性质,因此,统计推断可能是错 误的,也就是说,我们从数据上体现的只是统计上的关系, 而不是因果关系.

(3)统计学最关心的是:我们的数据能提供哪些信息. 具

体地说,面对一个实际问题,我们关心的是:①如何抽取数
据;②如何从数据中提取信息;③所得结论的可靠性. (4)求回归直线方程的一般方法. ①作出散点图,将问题所给的数据在平面直角坐标系中 描点,这样表示出的具有相关关系的两个变量的一组数据的 图形就是散点图,从散点图中我们可以看出样本点是否呈条 状分布,从而判断两个变量是否具有线性相关.

^,其中 ②求回归系数^ a,b
i=1

x ??yi-- y ? ?xiyi-n- x- y ? ?xi--
i=1

n

n

^= b


i=1

?

n

?xi-- x ?2

i=1

2 - - n x ?x2 i

n

^- ,^ a =- y -b x,

^ =b ^ x +^ ③写出回归直线方程y a ,并用回归直线方程进行 预报说明:当 x 取 x0 时,由线性回归方程可得 y0 的值,从而 可进行相应的判断.

(5)残差分析. ①对于样本点(x1,y1),(x2,y2),…,(xn,yn),当 ^=b ^ x+ ^ ^估计 y=bx+a+e 中的 我们用回归方程y a中的y bx + a 时 , 它 们 的 随 机 误 差 是 ei = yi - bxi - a(i = ^ i = yi - b ^ xi - ^ 1,2,3,…,n).其估计值为^ e i = yi - y a (i = 1,2,…,n),则^ ei 称为相应于点(xi,yi)的残差. ^ i)2 称为残差平方和,残差平方和在 ②将 ? (yi-y
i =1 n

一定程度上反映了所选回归模型的拟合效果,残差平 方和越小,说明模型的拟合效果越好;残差平方和越 大,说明拟合效果越差.

③通过残差分析判断模型拟合效果:先计算出残
^ =y -b ^ x -^ 差^ ei=yi-y a ,i=1,2,…,n,然后横坐标选 i i i

取为样本编号或解释变量或预报变量,纵坐标为残差,作出 残差图.通过图形分析,如果样本点的残差较大,就要分析 样本数据的采集是否有错误;另一方面,可以通过残差点分

布的水平带状区域的宽窄说明模型拟合效果,反映回归方程
的预报精度.带状区域的宽度越窄,说明模型的拟合精度越 高,回归方程的预报精度越高.

(6)相关指数R2. ①相关指数的计算公式是R2=1-

i=1 n

^ ?2 ? ?yi-y i
,其中

n

i=1

y ?2 ? ?yi--

i=1

?

n

^ )2 为残差平方和.相关指数用来刻画回归的效果,R2 (yi-y i

越大,说明模型的拟合效果越好;R2越小,说明拟合效果越 差. ②如果某组样本数据可以采取几种不同的回归模型进行 回归分析,则可以通过比较R2的值来作出选择,即选择R2值 大的模型作为这组数据的回归模型.

③在线性回归模型中R2是刻画回归效果的量,即表示回 归模型的拟合效果,也表示解释变量和预报变量的线性相关 关系.R2表示了解释变量对于预报变量变化的贡献率. (7)非线性回归问题. ①两个变量不呈线性相关关系,不能直接利用线性回归 方程来建立两个变量之间的关系,可以通过变换的方法转化 为线性回归模型.如y=c1ec2x,我们可以通过对数变换把指 数关系变为线性关系.令z=ln y,则变换后样本点应该分布在

直线z=bx+a(a=ln c1,b=c2)的周围.

②非线性回归方程的求法.
(Ⅰ)根据原始数据(x,y)作出散点图; (Ⅱ)根据散点图,选择恰当的拟合函数; (Ⅲ)作恰当的变换,将其转化成线性函数,求线性回归 方程; (Ⅳ)在(Ⅲ)的基础上通过相应的变换,即可得非线性回归 方程.

③非线性相关问题中常见的几种线性变换.

b (Ⅰ)反比例函数型 y=a+x, 1 作变换x=x′,则有 y=a+bx′. -b b (Ⅱ)幂函数型 y=ax 或 y=ax (b>0), 作变换 y′=lg y,a′=lg a,x′=lg x,则有 y′ =a′± bx′.

线性回归模型的求解及应用 以下是某地搜集到的新房屋的销售价格y和房屋 的面积x的数据: 房屋面积/m2 115 110 80 135 105

销售价格/万元

24.8

21.6

18.4

29.2

22

(1)画出数据对应的散点图; (2)求线性回归方程,并在散点图中加上回归直线;

(3)据(2)的结果估计当房屋面积为150 m2时的销售价格.

分析:解答过程如下: 套用公式计算 画散点图 ? 判断是否线性相关 ? ? 、? 得回归方程 ? b a

令x=150代入方程得销售价格
解析:(1)根据表中提供的数据可作出散点图如下:

5 5 1 (2)- x = ?xi=109,lxx= ? (xi-- x )2=1 570, 5i=1 i=1

- y =23.2,lxy= ? (xi-- x )(yi-- y )=308.
i=1

5

^ =b ^x+^ 设所求回归直线方程为y a, lxy 308 ^ ^- 则b= = ≈0.196 2,^ a =- y -b x =1.814 2. lxx 1 570 ^=0.196 2x+1.814 2. 故所求回归直线方程为y ^=0.196 (3)据(2), 当 x=150 m2 时, 销售价格的估计值为y 2×150+1.814 2=31.244 2(万元).

点评:若已知两个变量x与y具有线性相关关系,可直接 根据数据套用公式求出 b 、a ,便可得到x与y间的回归直线方
? ?

程.若没有明确说明两个变量x与y是否具有线性相关关系,
则可通过散点图进行直观判断,只有当两个变量具有线性相 关关系时,才有必要求回归直线方程,并用这个方程进行估 计和预报.

跟踪训练 1.某种产品的广告费用支出x与销售额y之间有如下的对 应数据(单位:万元) x/万元 y/万元 2 30 4 40 5 60 6 50 8 70

(1)画出散点图; (2)求回归方程; (3)据此估计广告费用支出为10万元时,销售额y的值.

解析:(1)作出散点图如图.

1 - (2) x = ×(2+4+5+6+8)=5, 5 1 - y = ×(30+40+60+50+70)=50, 5
2 2 2 2 2 = 2 + 4 + 5 + 6 + 8 =145, ?x2 i 5

i=1 5

i=1

?xiyi=2×30+4×40+5×60+6×50+8×70=1 380.

^= 所以b

i=1

x- y ?xiyi-5-
2 2 - x - 5 x ?i 5

5

1 380-5×5×50 = =6.5, 145-5×52

i=1

^ ^- a =- y -b x =50-6.5×5=17.5, ^=6.5x+17.5. 因此回归方程为y ^=10×6.5+17.5=82.5(万元). (3)x=10 时,y

模型拟合效果的分析
一个车间为了规定工时定额,需要确定加工零件 所花费的时间,为此进行了10次试验,测得数据如下:
零件数x/个
加工时间y/分钟

10 20 30 40
62 68 75 81

50
89

60

70

80

90

100

95 102 108 115 122

(1)如果y与x具有线性相关关系,求回归直线方程; (2)根据求出的回归直线方程,预测加工200个零件所用 的时间为多少? (3)求出相关指数R2,作出残差图,并对模型拟合效果进 行分析.

解析:(1)列出下表:
i 1 2 3 4 5 6 7 8 9 10

xi
yi xiyi

10
62

20
68

30
75

40
81 3240

50
89

60
95

70
102 7140

80
108

90
115

100
122 12200

620 1360 2250

4450 5700
10

8640 10350
10

2 - - ∴ x =55,y =91.7, xi =38 i=1

?

2 500, yi =87 i =1

?

777,

?xiyi=55 950,
i=1

10

^ =b ^x+^ 设所求的回归直线方程为y a,则有
i=1

x- y ?xiyi-10-
2 - - 10 x ?x2 i 10

10

^= b

55 950-10×55×91.7 = ≈0.668, 38 500-10×552

i=1

^ ^- a =- y -b x =91.7-0.668×55=54.96, ^=0.668x+54.96. 因此,所求的回归直线方程为y

(2)这个回归直线方程的意义是当x每增加1时,y的值约增加 0.668,而54.96是y不随x的增加而变化的部分,因此,当x=200 ^ 时,y的估计值为 y =0.668×200+54.96=188.56≈189.因此,加 工200个零件所用的时间约为189分钟.

(3)列出残差表:
yi 62 61.6 68 68.3 -23.7 -0.30 75 75.0 -16.7 0 81 81.7 -10.7 -0.70 89 88.4 -2.7 0.60 95 95.0 3.3 0 102 101.7 10.3 0.30 108 108.4 16.3 -0.40 115 115.1 23.3 -0.10 122 121.8 30.3 0.20

^ yi

yi-- y -29.7

^ yi - y i

0.40

所以 ? (yi - - y )2 = ( - 29.7)2 + ( - 23.7)2 + … + 30.32 =
i=1

10

3 688.1.

i=1

^ )2=0.402+(-0.30)2+…+0.202=1.4. ? (yi-y i

10

i=1

?

10

^ ?2 ?yi-y i 1.4 =1- ≈1 - 0.000 38 = 3 688.1

即 R =1-

2

i=1

y ?2 ? ?yi--

10

0.999 62.

根据表格作出残差图,如图

注:横坐标为零件个数,纵坐标为残差. 由R2=0.999 62非常接近于1,可知回归直线模型拟合 效果较好,由残差图中的残差点比较均匀地落在水平的带 状区域中,也说明选用的线性回归模型较为合适,带状区

域的宽度,比较狭窄,说明了模型拟合精度较高.

点评:解决本题的关键在于公式的运用.

跟踪训练 2.已知某种商品的价格x(元)与需求量y(件)之间的关系 有如下一组数据: x 14 16 18 20 22

y
坏.

12

10

7

5

3

求y对x的回归直线方程,并说明回归模型拟合效果的好

1 - 解析: x = ×(14+16+18+20+22)=18. 5 1 - y = ×(12+10+7+5+3)=7.4. 5
2 2 2 2 2 2 xi =14 +16 +18 +20 +22 =1 i=1

?

5

660.

i=1

?xiyi=14×12+16×10+18×7+20×5+22×3=620.
x- y ?xiyi-5-
2 2 - x - 5 x ?i 5 5

5

^= 所以b

i=1

620-5×18×7.4 = 2 =-1.15. 1 660-5×18

i=1

^ a=7.4+1.15×18=28.1. ^=-1.15x+28.1. 所以所求回归直线方程为y

列出残差表如下:

^ yi ^ yi-yi - yi- y
5

12 0 4.6

9.7 0.3 2.6

7.4 -0.4 -0.4
5

5.1 -0.1 -2.4

2.8 0.2 -4.4

2 ^ )2=0.3, ? (y -- 所以 ? (yi-y y ) =53.2. i i i=1 i=1

i=1

?
5

5

^ ?2 ?yi-y i ≈0.994. ?yi-- y i?2

R2=1-

i=1

?

因为 R2≈0.994,所以回归模型的拟合效果很好.
点评:数据运算繁杂,通常采用分步计算的方法.由相 关指数R2可以看出回归的拟合效果很好.可以计算相关系数r, 看两个变量的线性相关关系是否很强.

非线性回归分析 在化学反应过程中某化学物质的反应速度y g/min 与一种催化剂的量x g有关,现收集了8组数据列于表中,试建 立y与x之间的回归方程. x/g y /g·min-1 15 18 21 24 27 30 33 36

6

8

30

27

70

205

65

350

解析:根据收集的数据作散点图如下页所示:

根据样本点分布情况可选用两种曲线模型来拟合。 (1)可认为样本点集中在某二次曲线y=c1x2+c2的附近,

令t=x2,则变换后样本点应该分布在直线y=bt+a(b=c1,a
=c2)的周围. 由题意得变换后t与y样本数据表:

t y

225 6

324 8

441 30

576 27

729 70

900 205

1 089 65

1 296 350

作y与t的散点图如下:

由y与t的散点图可观察到样本数据点并不分布在一条直线 的周围,因此不宜用线性回归方程y=bt+a(b=c1,a=c2)来 拟合,也不宜用二次曲线y=c1x2+c2来拟合y与x之间的关系.

(2)根据x与y散点图也可以认为样本点集中在某一条指数 型函数y=c1ec2x的周围. 令z=ln y,则z=c2x+ln c1. 即变换后样本点应该分布在直线z=bx+a(a=ln c1,b= c2)的周围.由y与x的数据表可得z与x的数据表: x z 15 1.792 18 2.079 21 3.401 24 3.296 27 4.248 30 5.323 33 4.174 36 5.858

作出z与x的散点图如下:

由散点图可观察到大致在一条直线上,所以可用线性回 归方程来拟合.

由z与x数据表,得到线性回归方程,

z =0.181 2x-0.848 5,

?

所以非线性回归方程为 y=e0.181 2x-0.848 5.

?

因此,该化学物质反应速度对催化剂的量的非线性回归
方程为 y =e0.181 2x-0.848 5.
?

点评:非线性回归分析有时并不给出经验公式,这时我
们可以画出已知数据的散点图,把它与必修模块1中学过的各 种函数(幂函数、指数函数、对数函数等)图象作比较,挑选 一种跟这些散点拟合的最好的函数,然后像本例这样,采用 适当的变量置换,把非线性回归问题转化为线性回归问题.

跟踪训练 3.某种书每册的成本费y(元)与印刷册数x(千册)有关, 经统计得到数据如下: x 1 2 3 5 10 20 30 50 100 200

y 10.15 5.52 4.08 2.85 2.11 1.62 1.41 1.30 1.21 1.15
检验每册书的成本费y与印刷册数的倒数 1 之间是否具有 线性相关关系,如有,求出y对x的回归方程.
x

1 解析:首先作变量置换u= ,题目所给数据变成如下 x 表所示的10对数据:
u y 1 10.15 0.5 0.33 0.2 0.1 0.05 0.03 0.02 0.01 0.005 1.15 5.52 4.08 2.85 2.11 1.62 1.41 1.30 1.21

然后作相关性检验. 经计算得 r=0.999 8>0.75,从而认为 u 与 y 之间具有线 性相关关系. ^=8.973, 由公式得^ a=1.126,b ^=1.126+8.973u. 所以y 1 由 u= , x 8.973 ^ 可得y=1.126+ , x

这就是题目要求的y对x的回归曲线方程,回归曲线的图 形如下图所示,它是经过平移的反比例函数图象的一个分 支.

1.建立回归模型的基本步骤为: (1)确定研究对象,明确哪个变量是解释变量,哪个变量是 预报变量; (2)画出解释变量和预报变量的散点图,观察它们之间的关 系(如是否存在线性关系等);

(3)由经验确定回归方程的类型(如观察到数据呈线性关系,
则选用线性回归方程); (4)按一定规则(如最小二乘法)估计回归方程中的参数;

(5)得出结果后分析残差图是否有异常(如个别数据对应残 差过大,残差呈现不随机的规律性等).若存在异常,则检查 数据是否有误,或模型是否合适等. 2.分析两个变量相关关系的常用方法. (1)利用散点图进行判断:把样本数据表示的点在平面直 角坐标系中作出,从而得到散点图,如果这些点大致分布在 通过散点图中心的一条直线附近,那么就说这两个变量之间 具有线性相关关系. (2)利用相关指数R2进行判断.

3.对具有相关关系的两个变量进行统计分析时,首先 进行相关性检验,在确认具有线性相关关系后,再求回归直 线方程.

对于非线性回归问题,可以转化为线性回归问题去解
决.

基础训练 1.下列结论正确的是( C )

①函数关系是一种确定性关系;②相关关系是一种非确 定性关系;③回归分析是对具有函数关系的两个变量进行统 计分析的一种方法;④回归分析是对具有相关关系的两个变 量进行统计分析的一种常用方法.
A.①② B.①②③ C.①②④ D.①②③④

解析:根据函数关系、相关关系、回归关系的概念可知选C.

2.(2011· 东莞一模)在回归分析中,代表了数据点和它在 回归直线上相应位置的差异的是( B ) A.总偏差平方和 C.回归平方和 B.残差平方和 D.相关指数R2

3.下表是某工厂6~9月份用电量(单位:万度)的一组数 据: 月份x 用电量y 6 6 7 5 8 3 9 2

由散点图可知,用电量y与月份x间有较好的线性相关关 ^ =-1.4x+a,则a等于( 系,其线性回归直线方程是 y ) A.10.5 B.5.25

C.5.2 D.14.5 解析:由题知- x =7.5,- y =4,代入方程解得 a=14.5, 故选 D. 答案:D

4.(2013· 广东四校联考)某产品的广告费用x与销售额 y的统计数据如下表: 广告费用x(万元) 销售额y(万元) 4 49 2 26 3 39 5 54

^ ^ ^ ^中的b 根据上表可得回归方程y=bx+a 为9.4,据此模型预

报广告费用为6
A .63.6万元 C .67.7万元

B
B .65.5 D .72.0万元

5.(2011· 陕西卷)设(x1,y1),(x2, y2),…,(xn,yn)是变量x和y的n个样本

点,直线l是由这些样本点通过最小二
乘法得到的线性回归直线(如图),以下 结论正确的是( A )
A.直线 l 过点( x , y )

B.x和y的相关系数为直线l的斜率 C.x和y的相关系数在0到1之间 D.当n为偶数时,分布在l两侧的样本点的个数一定相同

6.两个变量y与x的回归模型中,分别选择了4个不同模 型,它们的相关指数R2如下,其中拟合效果最好的模型是 ( A ) A.模型1的相关指数R2为0.98 B.模型2的相关指数R2为0.80 C.模型3的相关指数R2为0.50 D.模型4的相关指数R2为0.25

7.有下列关系:①人的年龄与他(她)拥有的财富之间的 关系;②曲线上的点与该点的坐标之间的关系;③苹果的产

量与气候之间的关系;④森林中的同一种树木,其断面直径
与高度之间的关系;⑤学生与他(她)的学号之间的关系,其

①③④ 中有相关关系的是____________ .

8.(2013· 广州一模)某工厂的某种型号的机器的使用 年限x和所支出的维修费用y(万元)有下表的统计资料:

x y

2 2.2
?

3 3.8

4 5.5
?

5 6.5

6 7.0

根据上表可得回归方程 y =1.23x+ a ,据此模型估计, 该型号机器使用年限为10年的维修费用约_________________ 12.38 万元(结果保留两位小数).

9.(2011· 中山高考模拟)已知x、y之间的一组数据如下: x 0 1 2 3

y
?

8

2

6

4

则线性回归方程 y =a+bx所表示的直线必经过点
?3 ? ? ,5? ________ . ?2 ?

10.下表提供了某厂节能降耗技术改造后生产甲产品过 程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对 照数据. x y 3 2.5 4 3 5 4 6 4.5

(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性

^x+^ 回归方程 y=b a;

(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准 煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品 的生产能耗比技改前降低多少吨标准煤? (参考数值:3×2.5+4×3+5×4+6×4.5=66.5)

解析:(1)所求散点图如下图所示:

(2) ?xiyi=3×2.5+4×3+5×4+6×4.5=66.5,
i=1

n

3+4+5+6 - x= =4.5, 4 2.5+3+4+4.5 - y= =3.5, 4
2 2 2 2 2 x = 3 + 4 + 5 + 6 =86, ?i n

i=1

66.5-4×4.5×3.5 66.5-63 ^ b= = =0.7, 2 86-4×4.5 86-81 ^ ^- a =- y -b x =3.5-0.7×4.5=0.35,

故所求线性回归方程为y=0.7x+0.35. (3)根据回归方程的预测,现在生产100吨产品消耗的标 准煤的数量为0.7×100+0.35=70.35,故耗能减少了90- 70.35=19.65吨标准煤.

11.关于x与y有如下数据: x y 2 30 4 40 5 60
?

6 50

8 70
?

有如下两个线性模型:① y=6.5x+17.5;② y =7x+17.试

比较哪个拟合效果好?

^i 与 yi- y 的关系如下表: 解析:由①可得 yi-y
^ yi-y i
yi- y
-0.5
-20

-3.5
-10

10
10

-6.5
0

0.5
20

i=1

?

5

^ )2=(-0.5)2+(-3.5)2+102+(-6.5)2+0.52 (yi-y i =155.

i=1

?

5

(yi-- y i)2=(-20)2+(-10)2+102+02+202=1 000. ^ ?2 ? ?yi-y i
5 5

i=1

∴ R 1 =1 -

2

i=1

y i?2 ? ?yi--

155 =1 - =0.845. 1 000

^ 与 y -- 由②可得 yi-y y 的关系如下表: i i

^ yi-y i
yi- y
5 i=1 5

-1 -20

-5 -10

8 10

-9 0

-3 20

^ )2=(-1)2+(-5)2+82+(-9)2+(-3)2=180. ? (yi-y i y i)2=(-20)2+(-10)2+102+02+202=1 000. ? (yi-- ^ ?2 ? ?yi-y i
5 5

i=1

i=1

∴R 2=1-

2

i=1

?

?yi-- y i?2

180 =1 - =0.820. 1 000

∴R21>R22,∴①的拟合效果好于②的似合效果.

12.为了研究某种细菌随时间x变化,繁殖的个数收集数 据如下:

天数x/天 繁殖个数y/个

1 6

2 12

3 25

4 49

5 6 95 190

(1)用天数作解释变量,繁殖个数作预报变量,作出这些 数据的散点图; (2)求y与x之间的回归方程; (3)计算残差、相关指数R2.并描述解释变量与预报变量 之间的关系.

解析:(1)所求散点图如下:

(2)由散点图看出样本点分布在一条指数函数 y=c1ec2x的周围,于是令z=ln y,则

x z

1 1.79

2 2.48

3 3.22

4 3.89

5 4.55

6 5.25

由计算器算得^ z=0.69x+1.112,则有 ^=e0.69x+1.112. y
(3)由题意得:
y
?

6.06 6

12.09 12

24.09 25

48.04 49

95.77 95

190.9 190

y

i=1

2 ^ e2 i = ( y - y ) ? ? i i =3.164 3, i=1

n

n

i=1 2

?

n

^ )2= ?y2-n y2=25 553.3, (yi-y i i
i=1

n



3.164 3 R = 1- =0.999 9. 25 553.3 即解释变量天数对预报变量繁殖细菌的个数解释了 99.99 %。

真题再现 1.(2013· 湖北卷)四名同学根据各自的样本数据研究 变量x,y之间的相关关系,并求得回归直线方程,分别得到 ①y与x负相关且

②y与x负相关且
③y与x正相关且 ④y与x正相关且

? y = 2.347x-6.423; ? y = -3.476x+5.648; ? =5.347x+8.493; y ? = -4.326x - 4.578. y
D C.③④ D.

A.①②

B.

C

3.(2011· 安徽卷)某地最近十年粮食需求量逐年上升, 下表是部分统计数据: 年份 需求量/万吨 2004 236 2006 246 2008 257 2010 276 2012 286

(1)利用所给数据求年需求量与年份之间的回归直线方程
y =bx+a;
?

(2)利用(1)中所求出的直线方程预测该地2014年的粮食需 求量.

分析:本题考查回归分析的基本思想及其初步应用,回 归直线的意义和求法,数据处理的基本方法和能力,考查运 用统计知识解决简单实际应用问题的能力. 解析:(1)由所给数据看出,年需求量与年份之间是近似 直线上升,下面来求回归直线方程,为此对数据预处理如下: 年份-2008 需求量-257 -4 -21 -2 -11 0 0 2 19 4 29

对预处理后的数据,容易算得 x =0, y =3.2.

?-4?×?-21?+?-2?×?-11?+2×19+4×29 b= 42+22+22+42 260 = =6.5. 40 a= y -b x =3.2. 由上述计算结果,知所求回归直线方程为 ^-257=b(x-2008)+a=6.5(x-2008)+3.2, y ^=6.5(x-2008)+260.2① 即y
(2)利用直线方程①,可预测2012年的粮食需求量为 6.5(2014-2008)+260.2=6.5×6+260.2=299.2(万 吨)≈300(万吨).

4.(2012· 福建卷)某工厂为了对新研发的一种产品进行合理 定价,将该产品按事先拟定的价格进行试销,得到如下数据: 单价x/元 销量y/件 8 90 8.2 84 8.4 83 8.6 80 8.8 75 9 68

(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,

且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单
价应定为多少元?(利润=销售收入-成本)

分析:本题考查的知识点为线性回归中回归直线的求解 及二次函数的最值. 1 - 解析:(1) x = (8+8.2+8.4+8.6+8.8+9)=8.5, 6 1 - y = (90+84+83+80+75+68)=80, 6 ^=-20x+250. a= - y +20- x =80+20×8.5=250?y (2)工厂获得利润 z=(x-4)y=-20x2+330x-1 000. 33 当 x= 时,zmax=361.25(元). 4


相关文章:
1、1回归分析的基本思想及其初步应用
新课标 数学 选修 1-2 1.1 回归分析的基本思想及其初步应用 (教师用书独具) ●三维目标 1.知识与技能 通过典型案例的探究, 了解回归分析的基本思想,会对两个...
1.1回归分析的基本思想及其初步应用
1.1回归分析的基本思想及其初步应用_高二数学_数学_高中教育_教育专区。1.1 回归分析的基本思想及其初步应用(一) 教学要求:通过典型案例的探究,进一步了解回归分析...
1.1.1_回归分析的基本思想及其初步应用教案
高中数学新课标选修 1-2 课时计划 授课时间: 2012 年月日(星期 )第节 总第 课时 第一课时 1.1 回归分析的基本思想及其初步应用(一) 教学要求:通过典型案例...
1.1回归分析的基本思想及其初步应用
bx ? a 来描述 x y 的关系, 而是用线性回归模型 来描述, e 称为 随机误差产生的原因: (1)用线性回归模型近似代替真实模型引起的误差 (2)忽略了某些...
1.1回归分析的基本思想及其初步应用
阿尔山市一中高二年级数学学科导学案主备人 课题 代丽艳 课时 1 时间 45 分钟 1.1 回归分析的基本思想及其初步应用 学习目标 1.知识与技能:回忆线性回归模型与...
1.1回归分析的基本思想及其初步应用(1)
1.1回归分析的基本思想及其初步应用(1)_高二数学_数学_高中教育_教育专区。高效课堂导学案(包含预习案、探究案和训练案)高二导学案 班级 【学习目标】 学科:数学...
1.1回归分析的基本思想及其初步应用 教学设计 教案
1.1回归分析的基本思想及其初步应用 教学设计 教案。教学准备 1. 教学目标 1、能根据散点分布特点,建立不同的回归模型;了解有些非线性模型通过转化可以 转化为...
1.1回归分析的基本思想及其初步应用
1.1回归分析的基本思想及其初步应用_数学_高中教育_教育专区。1,在下列各量之间存在相关关系的是( )① ①正方体的体积与棱长之间的关系 ② ②一块农田的水稻...
1.1回归分析的基本思想及其初步应用
1.1回归分析的基本思想及其初步应用_数学_高中教育_教育专区。高二数学导学案 编制人: 审核人: 班级: 小组: 姓名: 等级: §.1.1 回归分析的基本思想及其初步...
更多相关标签:
回归分析的基本思想 | logistic回归基本思想 | 逐步回归的基本思想 | 逐步回归法的基本思想 | 毛泽东思想初步形成于 | 毛泽东思想初步形成 | 毛泽东思想的初步形成 | 毛泽东思想初步形成在 |