当前位置:首页 >> 数学 >>

回归分析的基本思想及其初步应用(1)


必修3(第二章 统计)知识结构
收集数据
(随机抽样)
整理、分析数据 估计、推断 用样本估计总体 变量间的相关关系

简 单 随 机 抽 样

分 层 抽 样

系 统 抽 样

用样本 的频率 分布估 计总体 分布

用样本 数字特 征估计 总体

数 字特征

线 性 回 归 分 析

统计的基本思想
实际 抽 样

样本

y = f(x)
模 分 析 拟

y = f(x)

? = f(x) y

复习、变量之间的两种关系
问题1:正方形的面积y与正方形的边长x之间 的函数关系是 确定性关系 y = x2 问题2:某水田水稻产量y与施肥量x之间是否 -------有一个确定性的关系? 例如:在 7 块并排、形状大小相同的试验田 上 进行施肥量对水稻产量影响的试验,得到 如下所示的一组数据:
施化肥量x 15

20

25

30

35

40

45

水稻产量y 330 345 365

405 445

450 455

1、定义: 自变量取值一定时,因变量的取值带有一定随

机性的两个变量之间的关系叫做相关关系。
注 1):相关关系是一种不确定性关系; 2):对具有相关关系的两个变量进行

统计分析的方法叫回归分析。

2、现实生活中存在着大量的相关关系。
如:人的身高与年龄; 产品的成本与生产数量;

商品的销售额与广告费;
家庭的支出与收入。等等 探索:水稻产量y与施肥量x之间大致有何 规律?

施化肥量x 15

20

25

30

35

40

45

水稻产量y 330 345 365 y
500 450 400 350 300 10

405 445

450 455
散点图

水稻产量

··
20

·

·

· · ·

施化肥量
30 40 50

x

探索2:在这些点附近可画直线不止一条, 哪条直线最能代表x与y之间的关系呢? 发现:图中各点,大致分布在某条直线附近。

500

y

水稻产量

450

? 400 |yi - yi |
350 300 10
n

· · ··
(xi ,yi )

· · ·
20

?) (xi ,y i

施化肥量
30 40 50

x

Q(a,b)= ?(yi - bxi - a)2 取最小值时,a,b的值.
i=1

推导过程请阅读P92

? ? 最小二乘法:y ? = bx+a
n ? ? (xi -x)(yi -y) ? ?b= ? i=1 = ? n 2 ? ? (xi -x) ? i=1 ? ? ?a=y-bx. ? ?

?x y
i=1 n

n

i i 2

- nxy - nx
2

?x
i=1

,

i

1 n 1 n 其中x = y= ? xi, ? yi. n i=1 n i=1

(x,y)

称为样本点的中心。

2、回归直线方程: ? +a 1、所求直线方程 y ? 叫做回归直 ? = bx ---线方程;其中

?

?= b

?(x
i=1

n

i

- x)(yi - y) = - x)
2 i

? x y - nxy
i i=1 n i

n

?(x
i=1

n

?x
i=1

2 i

- nx

2

,

? ? = y - bx a

2.相应的直线叫做回归直线。 3、对两个变量进行的线性分析叫做线性 回归分析。

相关系数
? 1.计算公式
r=

?(x
i=1 n i=1

n

i

- x)(yi - y)
n

2 2 (x x) (y y) ? i ? i i=1

? 2.相关系数的性质 ? (1)|r|≤1. ? (2)|r|越接近于1,相关程度越大;|r|越接 近于0,相关程度越小. ? 问题:达到怎样程度,x、y线性相关呢?它 们的相关程度怎样呢?

负相关

正相关

? n ? ? (xi -x)(yi -y) ? i=1 r= ? n n ? 2× (y -y)2 (x -x) ? i ? i ? i=1 i=1 ? r>0正相关;r<0负相关.通常,
r∈[-1,-0.75]--负相关很强; r∈[0.75,1]—正相关很强; r∈[-0.75,-0.3]--负相关一般; r∈[0.3, 0.75]—正相关一般; r∈[-0.25, 0.25]--相关性较弱;

相关系数

施化肥量x 15

20

25

30

35

40

45

水稻产量y 330 345 365 405 445 y 水稻产量 500
450 400 350 300

450 455

··
20

·

·

· · ·
施化肥量

解: 1.画出散点图 2.求出b = 4.75, a = 256.79 ? = 4.75x + 256.79 3.写出回归方程 y 4.计算相关系数 r = 0.9718

10

30

40

50

x

例题1 从某大学中随机选出8名女大学生,其身 高和体重数据如下表:
编号 1 2 165 57 3 157 50 4 170 54 5 175 64 6 165 61 7 155 43 8 170 59

身高 165 体重 48

求根据一名女大学生的身高预报她的体重的 回归方程,并预报一名身高为172cm的女 大学生的体重。

分析:由于问题中 要求根据身高预报 体重,因此选取身 高为自变量,体重 为因变量.

? = 0.849x - 85.172 身高172cm女大学生体重 y
? = 0.849×172 - 85.712 = 60.316(kg) y

3.通过探究栏目引入“线性回归模型”。此处可以引 导学生们体会函数模型与回归模型之间的差别。

(2)从散点图还可以看到,样本点散布在某一条 直线的附近,而不是一条直线上,所以不能用一次 函数y=bx+a来描述它们之间的关系。这时我 们用下面的线性回归模型来描述身高和体重的关系: y=bx+a+e其中a和b为模型的未知参数,e ? 是y与 之间的误差 ,通常e称为随机误差。 y
图表标题 80 60 40 20 0 150 160 170 180
2

y = 0.8485x - 85.712 体重 线性 (体重) 线性 (体重) 线性 (体重)

它的均值E(e)= 0,方差D(e)=σ > 0

(1)由图形观察可以看出,样本点呈条状分 布,身高和体重有比较好的线性相关关系,因 此可以用线性回归方程刻画它们之间的关系。
图表标题 80 60 40 20 0 150
? y

y = 0.8485x - 85.712 体重 线性 (体重) 线性 (体重) 线性 (体重) 170 180

? y
160

线性回归模型

?

y=bx+a+e
E(e)= 0,
2 D(e)=σ

y=bx+a+e其中a和b为模型的未知参数, e 是 y与 y ? 之间的误差,通常e称为随机误差。

为了衡量预报的精度,需要估计的σ2值?
Q(? , ? ) ? ? ( yi ? ? xi ? ? )2
i ?1 n

随机误差ei ? yi ? bxi ? a (i ? 1, 2,....n) ? ?a ? ? y ?y ? ? y ? bx ? 其估计值为: e
i i i i i

? i称为相应点(xi ,yi )的残差 e

类比样本方差估计总体方差的思想
n 1 1 2 ?)( n ? 2) ? ? ? ? ? e ? Q ( a , b ? i n?2 n ? 2 i ?1 ?)称为残差平方和 ?, b Q(a 2

(1)根据散点图来粗略判断它们是否线性相关。

(2)是否可以用线性回归模型来拟合数据

?1,e ?2,e ?3, .....e ?n, 来判断模型拟合的效 (3)通过残差 e 果这种分析工作称为残差分析
残差 6000 4000 2000 0 -2000 -4000 0 2 4 6 8 10 12 残差

使学生了解残差图的制作及作用。P98 ? 坐标纵轴为残差变量,横轴可以有不同的选择; ? 若模型选择的正确,残差图中的点应该分布在以 横轴为心的带形区域; ? 对于远离横轴的点,要特别注意。

身 高 与 体 重 残 差 图

异 常 点
? 错误数据 ? 模型问题

作业:P104习题3.1 第1题


相关文章:
1、1回归分析的基本思想及其初步应用
新课标 数学 选修 1-2 1.1 回归分析的基本思想及其初步应用 (教师用书独具) ●三维目标 1.知识与技能 通过典型案例的探究, 了解回归分析的基本思想,会对两个...
1.1.1_回归分析的基本思想及其初步应用教案
高中数学新课标选修 1-2 课时计划 授课时间: 2012 年月日(星期 )第节 总第 课时 第一课时 1.1 回归分析的基本思想及其初步应用(一) 教学要求:通过典型案例...
1.1回归分析的基本思想及其初步应用
1.1回归分析的基本思想及其初步应用_高二数学_数学_高中教育_教育专区。1.1 回归分析的基本思想及其初步应用(一) 教学要求:通过典型案例的探究,进一步了解回归分析...
1.1回归分析的基本思想及其初步应用
阿尔山市一中高二年级数学学科导学案主备人 课题 代丽艳 课时 1 时间 45 分钟 1.1 回归分析的基本思想及其初步应用 学习目标 1.知识与技能:回忆线性回归模型与...
1.1回归分析的基本思想及其初步应用(1)
1.1回归分析的基本思想及其初步应用(1)_高二数学_数学_高中教育_教育专区。高效课堂导学案(包含预习案、探究案和训练案)高二导学案 班级 【学习目标】 学科:数学...
回归分析的基本思想及其初步应用1
回归分析的基本思想及其初步应用(一)学习目标 1. 通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用; 2. 了解线性回归模型与函数模型的差异,了解衡...
1.1.1回归分析的基本思想及其初步应用
1.1.1回归分析的基本思想及其初步应用_数学_高中教育_教育专区。2015——2016 学年度下学期高二(文)数学组教学案(1-2) 主备人: 审核人: 本学期第 课时 本...
回归分析的基本思想及其初步应用 (1)
课主备: 学习目标 杜爱琴 题 回归分析的基本思想及其初步应用(1) 课型 预习+展示备课组长: 贺艾弘 统稿时间: 3 月 24 日 签审: 班级: 上课时间: 月日 ...
1-1 回归分析的基本思想及其初步应用
1-1 回归分析的基本思想及其初步应用 暂无评价|0人阅读|0次下载1.由一组数据(x1,y1),(x2,y2),…,(xn,yn)得到的回归直线方 ^ ^,则下列说法不正确的是...
更多相关标签:
回归分析的基本思想 | logistic回归基本思想 | 逐步回归法的基本思想 | 逐步回归的基本思想 | 毛泽东思想初步形成于 | 毛泽东思想初步形成 | 毛泽东思想的初步形成 | 初步广场舞的基本步骤 |