当前位置:首页 >> 数学 >>

《三维设计》2014届高考数学一轮复习教学案(基础知识+高频考点+解题训练)变量间的相关关系统计案例


变量间的相关关系__统计案例

[知识能否忆起] 一、变量间的相关关系 1.常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关 系不同,相关关系是一种非确定性关系. 2.从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称 为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关. 二、两个变量的线性相关 1. 从散点图上看, 如果这些点从整体上看大致分布在通过散点图中心的一条直线附近, 称两个变量之间具有线性相关关系,这条直线叫回归直线.

?xiyi-n x
^ ^ ^ ^ 2.回归方程为y=bx+a,其中b=
i=1

n

y ,

x2-n i i=1 ^ ^ a= y -b x .

?

n

x

2

2 3.通过求Q= ? ?yi-bxi-a? 的最小值而得到回归直线的方法,即使得样本数据的点到 i=1

n

回归直线的距离的平方和最小的方法叫做最小二乘法.

? ?xi- x ??yi- y ?
i=1

n

4.相关系数=
n n i=1 i=1



? ?xi- x ?2 ? ?yi- y ?2
当 r>0 时,表明两个变量正相关; 当 r<0 时,表明两个变量负相关. r 的绝对值越接近于 1,表明两个变量的线性相关性越强.r 的绝对值越接近于 0 时,表 明两个变量之间几乎不存在线性相关关系. 通常|r|大于 0.75 时, 认为两个变量有很强的线性 相关性. 三、独立性检验 1.2×2 列联表:假设有两个分类变量 X 和 Y,它们的值域分别为{x1,x2}和{y1,y2}, 其样本频数列联表(称 2×2 列联表)为:

y1 x1 x2 总计 a c a+c

y2 b d b+d

合计 a+b c+d a+b+c+d

n?ad-bc?2 K= (其中 n=a+b+c+d 为样本容量). ?a+b??a+c??b+d??c+d?
2

2.用 K2 的大小可以决定是否拒绝原来的统计假设 H0,若 K2 值较大,就拒绝 H0,即拒 绝事件 A 与 B 无关. 3.当 K2>3.841 时,则有 95%的把握说事件 A 与 B 有关; 当 K2>6.635 时,则有 99%的把握说事件 A 与 B 有关; 当 K2>2.706 时,则有 90%的把握说事件 A 与 B 有关. [小题能否全取] 1.(教材习题改编)观察下列各图形

其中两个变量 x、y 具有相关关系的图是( A.①② C.③④ B.①④ D.②③

)

解析:选 C 由散点图知③④具有相关关系. ^ 2.(教材习题改编)已知变量 x,y 之间具有线性相关关系,其回归方程为y=-3+bx, 若 ?xi=17, ?yi=4,则 b 的值为(
i=1 i=1 10 10

) B.1 D.-1

A.2 C.-2

17 4 ^ 解析: A 依题意知,x = =1.7,y = =0.4, 选 而直线y=-3+bx 一定经过点( x , 10 10 y ),所以-3+b×1.7=0.4,解得 b=2. 3.在一次对性别与说谎是否相关的调查中,得到如下数据:

说谎 男 女 合计 6 8 14

不说谎 7 9 16

合计 13 17 30

根据表中数据,得到如下结论中正确的一项是(

)

A.在此次调查中有 95%的把握认为是否说谎与性别有关 B.在此次调查中有 99%的把握认为是否说谎与性别有关 C.在此次调查中有 99.5%的把握认为是否说谎与性别有关 D.在此次调查中没有充分的证据显示说谎与性别有关 解析:选 D 30×?6×9-7×8?2 由于 K2= ≈0.0024,由于 K2 很小,因此,在此次调查 13×17×14×16

中没有充分的证据显示说谎与性别有关.故选 D. 4.某考察团对全国 10 大城市的居民人均工资收入 x(万元/年)与居民人均消费 y(万元/ ^ 年)进行统计调查,发现 y 与 x 具有相关关系,且 y 对 x 的回归方程为y=0.66x+1.562.若某 城市居民人均消费为 7.675(万元/年),估计该城市人均消费占人均工资收入的百分比约为 ________. 7.675-1.562 ^ 解析:因为当y=7.675 时,x= ≈9.262, 0.66 则 7.675 ≈0.829≈83%. 9.262

答案:83% 5.已知 x,y 之间的数据如表所示,则回归直线过点________. x y 1 1.2 2 1.8 3 2.5 4 3.2 5 3.8

解析: x =3, y =2.5, ∴样本点中心为(3,2.5),回归直线过样本点中心. 答案:(3,2.5) 1.回归分析是对具有相关关系的两个变量进行统计分析的方法, 只有在散点图大致呈线 性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义. 2.由回归方程进行预报,仅是一个预报值,而不是真实发生的值. 3.使用 K2 统计量作 2×2 列联表的独立性检验时,要求表中的 4 个数据都要大于 5, 在选取样本容量时一定要注意.

相关关系的判断

典题导入 [例 1] (2012· 新课标全国卷)在一组样本数据(x1,y1),(x2,y2),?,(xn,yn)(n≥2,x1, 1 x2,?,xn 不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,?,n)都在直线 y= x+1 2 上,则这组样本数据的样本相关系数为( A.-1 1 C. 2 ) B.0 D.1

[自主解答] 因为所有的点都在直线上,所以它就是确定的函数关系,所以相关系数为 1. [答案] D 由题悟法 1.相关关系的判断方法一是利用散点图直观判断,二是利用相关系数作出判断. 2.对于由散点图作出相关性判断时,若散点图呈带状且区域较窄,说明两个变量有一 定的线性相关性,若呈曲线型也是有相关性. 3.由相关系数 r 判断时|r|越趋近于 1 相关性越强. 以题试法

1.已知变量 x,y 之间具有线性相关关系,其散点图如图所示,则其 回归方程可能为( ^ A.y=1.5x+2 ^ B.y=-1.5x+2 ^ C.y=1.5x-2 ^ D.y=-1.5x-2 ^ 解析:选 B 设回归方程为y=bx+a.由散点图可知变量 x、y 之间负相关,回归直线在 ^ y 轴上的截距为正数,所以 b<0,a>0,因此其回归直线方程可能为y=-1.5x+2. 回归方程的求法及回归分析 )

典题导入 [例 2] (2012· 福建高考)某工厂为了对新研发的一种产品进行合理定价,将该产品按事 先拟定的价格进行试销,得到如下数据: 单价 x(元) 销量 y(件) 8 90 8.2 84 8.4 83 8.6 80 8.8 75 9 68

^ - - (1)求回归直线方程y=bx+a,其中 b=-20,a= y -b x ; (2)预计在今后的销售中, 销量与单价仍然服从(1)中的关系, 且该产品的成本是 4 元/件, 为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本) 1 [自主解答] (1)由于 x = (x1+x2+x3+x4+x5+x6)=8.5, 6 1 y = (y1+y2+y3+y4+y5+y6)=80. 6 ^ 所以 a= y -b x =80+20×8.5=250,从而回归直线方程为y=-20x+250. (2)设工厂获得的利润为 L 元,依题意得 L=x(-20x+250)-4(-20x+250) =-20x2+330x-1 000 33 =-20?x- 4 ?2+361.25. ? ? 当且仅当 x=8.25 时,L 取得最大值. 故当单价定为 8.25 元时,工厂可获得最大利润. 由题悟法 1.最小二乘法估计的一般步骤: (1)作出散点图,判断是否线性相关; ^ ^ (2)如果是,则用公式求a,b,写出回归方程; (3)根据方程进行估计. 2.回归直线方程必过定点( x , y ). 以题试法 2.(2012· 长春模拟)已知 x、y 取值如下表: x y 0 1.3 1 1.8 4 5.6 5 6.1 6 7.4 8 9.3

^ 从所得的散点图分析可知:y 与 x 线性相关,且y=0.95x+a,则 a=(

)

A.1.30 C.1.65

B.1.45 D.1.80

1 1 解析:选 B 依题意得, x = ×(0+1+4+5+6+8)=4, y = ×(1.3+1.8+5.6+6.1 6 6 ^ +7.4+9.3)=5.25;又直线y=0.95x+a 必过中心点( x , y ),即点(4,5.25),于是有 5.25= 0.95×4+a,由此解得 a=1.45. 独立性检验

典题导入 [例 3] (2012· 湖南衡阳第二次联考)衡阳市第一次联考后,某校对甲、乙两个文科班的 数学考试成绩进行分析,规定:大于或等于 120 分为优秀,120 分以下为非优秀.统计成绩 后,得到如下的 2×2 列联表,且已知在甲、乙两个文科班全部 110 人中随机抽取 1 人为优 3 秀的概率为 . 11 优秀 甲班 乙班 合计 10 30 110 非优秀 合计

(1)请完成上面的列联表; (2)根据列表中的数据,若按 99.9%的可靠性要求,能否认为“成绩与班级有关系”. 参考公式与临界值表:K2= P(K2≥k0) k0 n?ad-bc?2 ?a+b??c+d??a+c??b+d? 0.050 3.841 0.025 5.024 0.010 6.635 0.001 10.828

0.100 2.706

[自主解答] (1)列联表如下: 优秀 甲班 乙班 合计 10 20 30 非优秀 50 30 80 合计 60 50 110

110×?10×30-20×50?2 (2)根据列联表中的数据,得到 K2= ≈7.486<10.828. 60×50×30×80

因此按 99.9%的可靠性要求,不能认为“成绩与班级有关系”. 由题悟法 1.独立性检验的一般步骤: (1)根据样本数据制成 2×2 列联表; n?ad-bc?2 (2)根据公式 K2= 计算 K2 的值; ?a+b??a+d??a+c??b+d? (3)查表比较 K2 与临界值的大小关系,作统计判断. 2.在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错 误. 以题试法 3.(2012· 嘉兴联考)为了判断高中三年级学生选修文科是否与性别有关,现随机抽取 50 名学生,得到如下 2×2 列联表: 理科 男 女 合计 13 7 20 文科 10 20 30 合计 23 27 50

已 知 P(K2≥3.841)≈0.05 , P(K2≥5.024)≈0.025. 根 据 表 中 数 据 , 得 到 K2 = 50×?13×20-10×7?2 ≈4.844,则认为选修文科与性别有关系出错的可能性约为________. 23×27×20×30 解析:由 K2=4.844>3.841. 故认为选修文科与性别有关系出错的可能性约为 5%. 答案:5%


相关文章:
《三维设计》2014届高考数学一轮复习教学案(基础知识+...
《三维设计》2014届高考数学一轮复习教学案(基础知识+高频考点+解题训练)直线、平面垂直的判定与性质_高三数学_数学_高中教育_教育专区。直线、平面垂直的判定与性质...
《三维设计》2014届高考数学一轮复习教学案(基础知识+...
《三维设计》2014届高考数学一轮复习教学案(基础知识+高频考点+解题训练)基本不等式(含解析) - 副本_高考_高中教育_教育专区。A 组训练 1 1.函数 y=x+ (x...
《三维设计》2014届高考数学一轮复习教学案(基础知识+...
《三维设计》2014届高考数学一轮复习教学案(基础知识+高频考点+解题训练)直线的倾斜角与斜率、直线的方程_数学_高中教育_教育专区。直线的倾斜角与斜率、直线的方程...
《三维设计》2014届高考数学一轮复习教学案(基础知识+...
《三维设计》2014届高考数学一轮复习教学案(基础知识+高频考点+解题训练)等比数列及其前n项和(含解析)_数学_高中教育_教育专区。等比数列及其前 n 项和 [知识能...
《三维设计》2014届高考数学一轮复习教学案(基础知识+...
《三维设计》2014届高考数学一轮复习教学案(基础知识+高频考点+解题训练)直线与...故在 Rt△OPM 中,有 OP=2OM=2.由两点 间的距离公式得 OP= 答案:( 2,...
《三维设计》2014届高考数学一轮复习教学案(基础知识+...
《三维设计》2014届高考数学一轮复习教学案(基础知识+高频考点+解题训练)合情推理与演绎推理(含解析)_数学_高中教育_教育专区。第五节 合情推理与演绎推理 [知识...
《三维设计》2014届高考数学一轮复习教学案(基础知识+...
《三维设计》2014届高考数学一轮复习教学案(基础知识+高频考点+解题训练)导数的...某种商品在过去 50 天的销售量和价格均为销售时 间 t(天)的函数,且销售量...
《三维设计》2014届高考数学一轮复习教学案(基础知识+...
《三维设计》2014届高考数学一轮复习教学案(基础知识+高频考点+解题训练)空间向量...求两点间距离或 某一线段的长度,一般用向量的模来解决;解决垂直问题一般可转化...
《三维设计》2014届高考数学一轮复习教学案(基础知识+...
《三维设计》2014届高考数学一轮复习教学案(基础知识+高频考点+解题训练)基本不等式(含解析11)_高考_高中教育_教育专区。第四节 基本不等式 [知识能否忆起] a+...
《三维设计》2014届高考数学一轮复习教学案(基础知识+...
《三维设计》2014届高考数学一轮复习教学案(基础知识+高频考点+解题训练)椭圆_...F2 间的距离叫做椭圆的焦距. 2.椭圆的标准方程及其几何性质 条件 2a>2c,a2=...
更多相关标签:

相关文章