当前位置:首页 >> 数学 >>

1.1回归分析的基本思想及其初步应用


阿尔山市一中高二年级数学学科导学案
主备人 课题 代丽艳 课时 1 时间 45 分钟

1.1 回归分析的基本思想及其初步应用

学 习 目 标

1.知识与技能:回忆线性回归模型与函数模型的差异,理解用最小二乘法求回归模型的步 骤,了解判断两变量间的线性相关关系的强度——相关系数。了解评价回归效果的三个统 计量:总偏差平方和、残差平方和、回归平方和;了解偏差平方和分解的思想;了解判断 刻画模型拟合效果的方法——相关指数和残差分析; 了解非线性模型通过变换转化为线性 回归模型。了解回归模型的选择;进一步理解非线性模型通过变换转化为线性回归模型; 体会不同模型拟合数据的效果。 2.过程与方法:从实例出发,求出相应的回归直线方程,从中也找出存在的不足,从而有 进行回归分析的必要性,通过学习相关指数,用相关指数来刻画回归的效果 ,进而归纳出 回归分 析的一般步骤,并对具体问题进行回归分析,用于解决实际问题。 3.情感态度价值观:从实际问 题中发现自己已有知识的不足之处,激发学生的好奇心 和求知欲,培养学生不满足于已有知识,勇于求知的良好个性品质,引导学生积极进取。 1、了解线性回归模型与函数模型的差异;了解两变量间的线性相关关系的强度 ——相关系数。 2、了解判断刻画模型拟合效果的方法——相关指数和残差分析;通过探究使学 生体会有些非线性模型通过变换可以转化为线性回归模型。 3、加深体会有些非线性模型通过变换可以转化为线性回归模 型;了解在解决问 题的过程中寻找更好的模型的方法。 1.了解线性回归模型与一次函数模型的差异;了解偏差平方和分解的思想。 2.解释残差变量的含义;了解偏差平方和分解的思想。 3.了解常用函数的图像特点,选择不同的模型建模;通过比较相关指数对不同的模型 进行比较。 导 学 设 计

重点

一、基础知识梳理 1.回归直线: 如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相 关关系,这条直线叫作回归直线。 求回归直线方程的一般步骤:作出散点图(由样本点是否呈条状分布来判断两个量是否具有线 性相关关系),若存在线性相关关系→②求回归系数 →③写出回归直线方程 ,并利用回归直 线方程进行预测说明. 2.回归分析:对具有相关关系的两个变量进行统计分析的一种常用方法。 建立回归模型的基本步骤是: ①确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量; ②画好确定好的解释变量和预报变量的散点图,观察它们之间的关系(线性关系). ③由经验确定回归方程的类型. ④按一定规则估计回归方程中的参数 (最小二乘法); ⑤得出结论后在分析残差图是否异常,若存在异常,则检验数据是否有误,后模型是否合适等. 3.利用统计方法解决实际问题的基本步骤: (1)提出问题;(2)收集数据;(3)分析整理数据;(4)进行预测或决策。 4.残差变量 的主要来源: (1)用线性回归模型近似真实模型(真实模型是客观存在的,通常我们并不知道真实模型到底 是什么)所引起的误差。可能存在非线性的函数能够更好地描述 与 之间的关系,但是现 在却用线性函数来表述这种关系, 结果就会产生误差。 这种由于模型近似所引起的误差包含在 中。 (2)忽略了某些因素的影响。影响变量 的因素不只变量 一个,可能还包含其他许多因素 (例如在描述身高和体重关系的模型中,体重不仅受身高的影响,还会受遗传基因、饮食习惯、 生长环境等其他因素的影响),但通常它们每一个因素的影响可能都是比较小的,它们的影响 都体现在 中。 (3)观测误差。由于测量工具等原因,得到的 的观测值一般是有误差的(比如一个人的体 重是确定的数,不同的秤可能会得到不同的观测值,它们与真实值之间存在误差),这样的误 差也包含在 中。上面三项误差越小,说明我们的回归模型的拟合效果越好。 二、例题选讲 例 1:研究某灌溉渠道水的流速 水深 流速 (1)求 对 1.40 1.70 的回归直线方程; 时水的流速是多少? 与水深 1.50 1.79 之间的关系,测得一组数据如下: 1.60 1.88 1.70 1.95 1.80 2.03 1.90 2.10 2.00 2.16 2.10 2.21

难点

(2)预测水深为 1.95

分析:本题考查如何求回归直线的方程,可先把有关数据用散点图表示出来,若这些点大致分 布在通过散点图中心的一条直线附近,说明这两个变量线性相关,从而可利用我们学过的最小 二乘估计思想及计算公式求得线性回归直线方程。 解:

(1)由于问题中要求根据水深预报水的流速,因此选取水深为解释变量,流速为预报变量,作 散点图:

1999 2000 2001 2002

82067.5 89468.1 97314.8 104790.6

(1)作 GDP 和年份的散点图,根据该图猜想它们之间的关系应是什么。 (2)建立年份为解释变量,GDP 为预报变量的回归模型,并计算残差。 (3)根据你得到的模型,预报 2003 年的 GDP,并查阅资料,看看你的预报与实际 GDP 的误差是多 少。 (4)你认为这个模型能较好地刻画 GDP 和年份的关系吗?请说明理由。 解:(1)由表中数据制作的散点图如下:

由图容易看出,



之间有近似的线性关系,或者说,可以用一个回归直线方程

来反映这种关系。由计算器求得 对 的回归直线方程为 。 代入,易得



(2)由(1)中求出的回归直线方程,把 。

计算结果表示,当水深为 时可以预测渠水的流速为 。 评注:建立回归模型的一般步骤: (1)确定研究对象,明确两个变量即解释变量和预报变量; (2)画出散点图,观察它们之间的关系; (3)由经验确定回归方程类型(若呈线性关系,选用线性回归方程); (4)按一定规则估计回归方程中的参数(如最小二乘法); (5) 得出结果后分析残差图是否有异常 (个别数据对应残差过大, 或残差出现不随机的规律性, 等等),若存在异常,则检查数据是否有误,或模型是否合适等。 例 2:1993 年到 2002 年中国的国内生产总值(GDP)的数据如下: 年份 1993 1994 1995 1996 1997 1998 GDP 34634.4 46759.4 58478.1 67884.6 74462.6 78345.2

从散点图中可以看出 GDP 值与年份近线呈线性关系; (2)用 yt 表示 GDP 值,t 表示年份,根据截距和斜率的最小二乘计算公式, 得: 残差计算结果见下表: GDP 值与年份线性拟合残差表 年份 1993 残差 -6422.269 年份 1998 1994 -1489.238 1999 1995 3037.493 2000 1996 5252.024 2001 1997 4638.055 2002 从而得线性回归方程:

残差 1328.685 -2140.984 -1932.353 -1277.622 -993.791 (3)2003 年的 GDP 预报值为 112976.360,根据国家统计局 2004 年统计,2003 年实际 GDP 值为 117251.9,所以预报与实际相-4275.540; 2 (4)上面建立的回归方程的 R =0.974,说明年份能够解释约 97%的 GDP 值变化,因此所建立的模 型能够很好地刻画 GDP 和年份的关系。 说明: 关于 2003 年的 GDP 的值来源,不同的渠道可能会有所不同。 例 3:如下表所示,某地区一段时间内观察到的大于或等于某震级 x 的地震个数为 N,试建立回

归方程表述二者之间的关系。 震级 地震数 震级 地震数 3 28381 5.2 746 3.2 20380 5.4 604 3.4 14795 5.6 435 3.6 10695 5.8 274 3.8 7641 6 206 4 5502 6.2 148 4.2 3842 6.4 98 4.4 2698 6.6 57 4.6 1919 6.8 41 4.8 1356 7 25 5.0

之间的关系。根据截距和斜率的最小二乘计算公式,得:

973 故线性回归方程为: 相关指数 R ≈0.997,说明 x 可以解释 y 的 99.7%的变化。因此,可以用回归方程 描述 x 和 y 之间的关系。 例 4:电容器充电后,电压达到 化的规律公式 0 100 试求电压 对时间 1 75 ,然后开始放电,由经验知道,此后电压 表示,观测得时间 2 55 3 40 4 30 5 20 时的电压 6 15 7 10 8 10 随时间 变
2

解:由表中数据得散点图如下:

如下表所示: 9 5 10 5

的回归方程。

分析:由于两个变量不呈线性相关关系,所以不能直接利用线性回归方程来建立两个变量之间 的关系,我们可通过对数变换把指数关系变为线性关系,通过线性回归模型来建立 从散点图中可以看出,震级 x 与大于该震级的地震次数 N 之间不呈线性相关关系,随着 x 的减 少,所考察的地震数 N 近似地以指数形式增长. 做变换 y=lgN, 得到的数据如下表所示: x y x y 3 4.453 5.2 2.873 3.2 4.309 5.4 2.781 3.4 4.170 5.6 2.638 3.6 4.029 5.8 2.438 3.8 3.883 6 2.314 4 3.741 6.2 2.170 4.2 3.585 6.4 1.991 4.4 3.431 6.6 1.756 4.6 3.283 6.8 1.613 4.8 3.132 7 1.398 5 2.988 由所给数据可得 0 4.6 其散点图为: 1 4.3 2 4.0 3 3.9 4 3.4 5 2.9 6 2.7 7 2.3 8 2.3 9 1.6 10 1.6 ,令 ,即 。 间的非线性回归方程。 解:对 两边取自然对数得 与 之

x 和 y 的散点图如下:

从这个散点图中可以看出 x 和 y 之间有很强的线性相差性,因此可以用线性回归模型拟合它们 由散点图可知 与 具有线性相关关系,可用 来表示。经计算得:

A.模型 1 的相关指数 (最小二乘法), 。 所以, 。 , 即 C.模型 3 的相关指数 9.相关指数 =

为 0.98 为 0.50

B.模型 2 的相关指数 D.模型 4 的相关指数

为 0.80 为 0.25 。

评注:一般地,有些非线性回归模型通过变换可以转化为线性回归模型,即借助于线性回归模 型研究呈非线性回归关系的两个变量之间的关系: (1)如果散点图中的点分布在一个直线状带形区域,可以选用线性回归模型来建模; (2)如果散点图中的点的分布在一个曲线状带形区域,要先对变量作适当的变换,再利用线性 回归模型来建模。 如果 1.对具有相关关系的两个变量统计分析的一种常用的方法是( A.回归分析 A. 预报变量在 上 C.可以选择两个变量中任意一个变量在 在 轴上 ( ) C.越接近于-1 D.绝对值越接近 1 ) A.越接近于 0 A.0 当 堂 反 馈 B.1 3 94.8 B.越接近于 1 C.-1 4 104.2 5 108.7 ) B.她儿子 10 岁时的身高在 145.83 左右 D.她儿子 10 岁时的身高在 145.83 的系数 ) 9. 10.由于问题中要求根据单位面积化肥用量预报水稻相应的产量,因此选取单位面积的化 肥用量为解释变量,相应水稻的产量为预报变量,作散点图: ( 以 以 ) 3.两个变量相关性越强,相关系数 轴上 D.可以选择两个变量中任意一个变量 B.相关系数分析 轴上, 解释变量在 C.残差分析 轴上 2.在画两个变量的散点图时,下面叙述正确的是( ) 轴上, 预报变量在 轴 ) 时水稻的产量大约是多少?(精确到 11.假设美国 10 家最大的工业公司提供了以下数据: 公司 通用汽车 福特 埃克森 IBM 通用电气 美孚 菲利普·莫利斯 7 124.3 8 130.8 9 139.0 克莱斯勒 杜邦 德士古 销售总额经 x1/百万美元 126974 96933 86656 63438 55264 50976 39069 36156 35209 32416 利润 x2/百万美元 4224 3835 3510 3758 3939 1809 2946 359 2480 2413 ) D.相关指数分析 与 10.某农场对单位面积化肥用量 据如下: 15 330 20 345 25 365 30 405 35 445 40 450 45 455 和水稻相应产量 的关系作了统计,得到数

之间具有线性相关关系,求出回归直线方程,并预测当单位面积化肥用量为

B.解释变量在

4.若散点图中所有样本点都在一条直线上,解释变量与预报变量的相关系数为( D.-1 或 1 6 117.8 5.一位母亲记录了她儿子 3 到 9 岁的身高,数据如下表: 年龄(岁) 身高(

由此她建立了身高与年龄的回归模型 时的身高,则下面的叙述正确的是( A.她儿子 10 岁时的身高一定是 145.83 上 C.她儿子 10 岁时的身高在 145.83 下

,她用这个模型预测儿子 10 岁

(1)作销售总额和利润的散点图,根据该图猜想它们之间的关系应是什么形式; (2) 建立销售总额为解释变量,利润为预报变量的回归模型,并计算残差; (3) 你认为这个模型能较好地刻画销售总额和利润之间的关系吗?请说明理由。 参考答案: A B D B C A A A

6.两个变量有线性相关关系且正相关, 则回归直线方程中, A. B. C. D. 7.两个变量有线性相关关系且残差的平方和等于 0,则( A.样本点都在回归直线上 C.样本点比较分散 8.在建立两个变量 与 D.不存在规律

B.样本点都集中在回归直线附近 的回归模型中,分别选择了 4 个不同的模型,它们的相关指数 )

如下,其中拟合最好的模型是(

关关系; (2)由最小二乘法的计算公式,得: 则线性回归方程为: 其残差值计算结果见下表: 销售总额 利润 残差 销售总额 利润 残差 由图容易看出, 与 之间有近似的线性关系,或者说,可以用一个回归直线方程 。 ( *)。 代入 。 时水稻的产量大约是 . 126974 4224 -361.034 50976 1809 -830.486 96933 3835 19.015 39069 2946 611.334 86656 3510 -42.894 36156 359 -1901.09
2

63438 3758 799.487 35209 2480 244.150

55264 3939 1189.742 32416 2413 248.650

来反映这种关系。由计算器求得 对 的回归直线方程为

(3)对于(2)中所建立的线性回归方程,相关指数为 R ≈0.457,说明在线性回归模型中销 售总额只能解释利润变化的 46%,所以线性回归模型不能很好地刻画销售总额和利润之间 的关系。 说明: 此题也可以建立对数模型或二次回归模型等, 只要计算和分析合理, 就算正确。 1. 熟练掌握求线性回归方程的步骤; ⑴画出两个变量的散点图; ⑵判断是否线性相关; ⑶求回归直线方程(利用最小二乘法) ; ⑷并用回归直线方程进行预报。 2. 理解线性回归模型与一次函数的不同; 一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形 式. 3. 了解相关系数的计算与解释。

由(*)中求出的回归直线方程,把 易得

计算结果表示,当单位面积化肥用量为 11.

(1)将销售总额作为横轴,利润作为纵轴,根据表中数据绘制散点图如下:

当 堂 收 获

相关系数: r ?

? ?x
i ?1

n

i

? x ?? yi ? y ?
2

? ?x
i ?1

n

i

? x?

? ?y
i ?1

n

i

? y?

2

由于散点图中的样本点基本上在一个带形区域分布, 猜想销售总额与利润之间呈现线性相

4.分清总偏差平方和、残差平方和、回归平方和,初步了解如何评价模型拟合效果的好坏; 5.注意回归方程适用的范围、时间。 6.归纳非线性回归模型的求解步骤: ⑴画出两个变量的散点图; ⑵判断是否线性相关; ⑶非线性相关模型要进行变换,转为线性回归模型; ⑷求出回归模型的方程(利用最小二乘法) 。

家 庭 作 业 教 学 反 思

习题 1.1 NO.3

学生已经初步学会用最小二乘法建立线性回归模型的知识, 并能用所学知识解决一些 简单的实际问题。回归分析是数理统计中的重要内容,在教学中,要结合实例进行相关性 检验,理解只有两个变量相关性显著时,回归方程才具有实际意义。在起点低的班级中注 重让学生参与实践,结合画图表的方法整理数据,鼓励学生通过收集数据,经历数据处理 的过程,从而认识统计方法的特点,达到学习的目的。

主管校长审核___________

教务主任审核____________

备课组长审核_______________


相关文章:
高中数学选修1-2,1.1回归分析的基本思想及其初步应用_图文.ppt
高中数学选修1-2,1.1回归分析的基本思想及其初步应用 - 第一章 统计案例
《1.1回归分析的基本思想及其初步应用》ppt课件6_图文.ppt
1.1回归分析的基本思想及其初步应用》ppt课件6_数学_高中教育_教育专区。高二数学 选修1-2 1.1回归分析的基 本思想及其初步 应用 2015/11/12 郑平正 制作 ...
选修1-2_1.1回归分析的基本思想及其初步应用.ppt
选修1-2_1.1回归分析的基本思想及其初步应用_高二数学_数学_高中教育_教育
1.1回归分析的基本思想及其初步应用(1)作业.doc
1.1回归分析的基本思想及其初步应用(1)作业 - 大白高中高二数学学练稿 主备
1.1《回归分析的基本思想及其初步应用》(1课时)_图文.ppt
1.1回归分析的基本思想及其初步应用》(1课时) - 第一章 统计案例 数学3
1.1回归分析的基本思想及其初步应用(优质课)_图文.ppt
1.1回归分析的基本思想及其初步应用(优质课) - 普通高中课程标准实验教科书
高中数学选修1-2_1.1回归分析的基本思想及其初步应用.ppt
高中数学选修1-2_1.1回归分析的基本思想及其初步应用_高二数学_数学_高中教
1.1回归分析的基本思想及其初步应用(1)_图文.ppt
1.1回归分析的基本思想及其初步应用(1) - 统计的基本思想 实际 抽样 样本
《1.1回归分析的基本思想及其初步应用》ppt课件_图文.ppt
1.1回归分析的基本思想及其初步应用》ppt课件 - 1.1 回归分析的基本思想及其初步应用 【课标要求】 1.了解随机误差、残差、残差分析的概念; 2.会用残差分析...
1、1回归分析的基本思想及其初步应用.doc
1、1回归分析的基本思想及其初步应用 - 新课标 数学 选修 1-2 1.1 回归分析的基本思想及其初步应用 (教师用书独具) ●三维目标 1.知识与技能 通过典型案例的...
《1.1回归分析的基本思想及其初步应用》课件(共42张PPT....ppt
1.1回归分析的基本思想及其初步应用》课件(共42张PPT) - 第一章 统计
1.1回归分析的基本思想及其初步应用(1)_图文.ppt
1.1回归分析的基本思想及其初步应用(1) - 必修3(第二章 统计)知识结构
1.1回归分析的基本思想及其初步应用_图文.ppt
1.1回归分析的基本思想及其初步应用 - 1.1回归分析的基本思想及其初步应用 1. 画散点图 2. 求出b,a的值。 3. 求回归直线方程 4. 用回归直线方程解决应用...
《1.1回归分析的基本思想及其初步应用》(优秀)_图文.ppt
1.1回归分析的基本思想及其初步应用》(优秀) - 高二数学 选修1-2 1.1回归分析的基 本思想及其初步 应用 2018/5/31 郑平正 制作 比《数学3》中“回归”...
1.1回归分析的基本思想及其初步应用_图文.ppt
1.1回归分析的基本思想及其初步应用 - 高二数学 选修1-2 1.1回归分析的基 本思想及其初步 应用 2013-7-27 郑平正 制作 比《数学3》中“回归”增加的内容 ...
1.1回归分析的基本思想及其初步应用_图文.ppt
1.1回归分析的基本思想及其初步应用 - 1.1回归分析的基本 思想及其初步应用 数学必修3第二章 统计 2.1 2.2 2.3 随机抽样 用样本估计总体 变量间的...
1.1回归分析的基本思想及其初步应用_图文.ppt
1.1回归分析的基本思想及其初步应用 - 1.1回归分析的基本思想 及其初步应用 必修3(第二章 统计)知识结构 收集数据 (随机抽样) 整理、分析数据 估计、推断 用...
1.1回归分析的基本思想及其初步应用_图文.ppt
1.1回归分析的基本思想及其初步应用 - 第一章 统计案例 1 .1 回归分析的基本思想及 其初步应用 我们知道 ,函数关系是一种确定 性关系 , 而相关关系是一种非...
1.1回归分析的基本思想及其初步应用课件_图文.ppt
1.1回归分析的基本思想及其初步应用课件 - 人民教育出版社A版选修1-2 1.1回归分析的基本 思想及其初步应用 (共计4课时 第1课时) 2007年5月,中共中央国务院...
课时1-1.1回归分析的基本思想及其初步应用_教学设计_教案.doc
课时1-1.1回归分析的基本思想及其初步应用_教学设计_教案 - 教学准备 1.
更多相关标签: