当前位置:首页 >> 经济学 >>

关联分析 spss


1. 两变数关联分析
(Association) 第一节 第二节 第三节 第四节 第五节 两变数关联分析原理 SPSS的Correlate分析 的 分析 相关分析范例 SPSS的Crosstabs分析 的 分析 Crosstabs的应用范例 的应用范例

学习目标
认识计算两变数「关联分析」的「关联系数」种类. 探讨「相关」与「关连」及「相关分析」与「关联分析」的差异. 了解相关系数的计算原理及公式. 了解其它关联系数的计算原理与公式. 认识卡方检定的适用情况. 认识SPSS的Correlation程序与介面如何操作. 认识SPSS的各种Correlate应用实例. 认识SPSS的Crosstabs程序与介面如何操作. 认识SPSS的各种Crosstabs应用实例. 探讨SPSS的Crosstabs如何解释及如何应用於民意调查.

第一节 两变数关联分析原理
一,关联方析的统计量 二,相关分析原理 三,交叉表的卡方检定原理

一,两变数关联分析原理
本节将介绍两变数关联分析(Analysis of Association) 的原理,包括衡量两变数关联程度的统计量数. 将两变数间的关联(association)情形加以数量化所得 之指标称为关联量数(Measures of Association). 大家最熟悉的皮尔逊积差相关(Pearson ProductMoment Correlation)或称Pearson相关系数,仅是用 来衡量计量变数间关联程度之一种指标. 单独一种量数无法包括各种不同的关联型态.

表1 两变数之尺度及其适用的关联系 数

关联系数应用的情况(1/2)
在实际应用上,仍以Pearson相关系数与Chi-Square 卡方值最为常见. 本章主要介绍两个探讨变数间关联强度之程序,分别 为Correlate和Crosstabs. Correlate可用於区间或比例尺度与顺序尺度测量之变 数;Crosstabs可用於各种尺度之变数,但通常若为计 量的区间与比例尺度则采Correlate. Crosstabs也可计算Pearson积差相关,但因此时变数 之可能值太多,所得到的列联表意义不大,故以 Correlate处理较为恰当.

关联系数应用的情况(2/2)
两计质变数,如名目尺度一定要采用Crosstabs.若为 顺序尺度,通常亦以Correlate来分析变数之相关;当 然也可采用Crosstabs,但若是5×5则产生的表格即太 大了,建议还是采用Correlate较为恰当,若是3×3的 情况,则可采 Crosstabs程序来分析. 对任何电脑统计软体与程序而言,系统无法知道使用 者所输入之数值资料是何种尺度,系统提供了各种统 计量与程序来供使用者选择.至於应使用何种统计量 或程序,端视使用者对资料与统计之理解而定.

二,相关分析原理(1/3)
相关(Correlation)是用以检验两个变数线性关系的 统计技术.两个连续变数的关联情形,除了用散布图 的方式来表达,还可用相关系数(coefficient of correlation)来衡量. 线性关系(Linear Relationship)乃指两个连续变数 之间的关系,可以被一条最具代表性的直线来表达其 存在的关联情形. 相关系数是一个标准化的关联系数,其原理是先计算 出两个变数的共变量,再除去两个变数的不同分散情 形与单位差异(即标准差)加以标准化.

相关分析原理(2/3)
cov( x , y ) r = = sxsy ∑ ( X X )( Y Y ) ∑ ( X X ) (Y Y )
2 2

=

SP xy SS x SS
y

相关系数介於-1至1之间. 相关程度的大小并非与r系数大小成绝对正 比,相关系数的大小须经显著性检定来证明 是否显著. 不能直接由相关系数的大小来判断其是否达 显著水准,因相关系数为t分配,SPSS会自 动检定相关系数是否达到显著水准.

相关分析原理(3/3)
斯皮尔曼等级相关(Spearman Rank-Order Correlation)计算
此系数的符号为rs(rho)应用於顺序变数线性关系之 描述.

净相关
如果两个连续变数之间的关系,可能受到其他变数的 干扰之时,可以利用控制的方式,将第三变数的效果 进行统计的控制. 在计算两个连续变数X1与X2的相关之时,将第三变 数(X3)与两个相关变数的相关与予以排除之后的纯 净相关,以 来表示.

X2

三,交叉表的卡方检定原理
若是单一的分类变数,分成r类,可得到次数 分配表. 若是两个类别变数,则可进行交叉表分析并进 行卡方(Chi-Square, χ )检定. 若变数一分为r类,变数二分为c类,可得r×c 交叉表(Cross-tabulation)或称交叉分析表,列 联表(Contingency table).
2

X2

分类变数卡方检定的类型 (1/2)
分类变数的分析,SPSS提供了无母数检定 (NPAR),对数模式(LOGLINEAR)与 交叉列联表(CROSSTABS)三种程序来进 行卡方检定 . 适合度检定(good-of-fit test):某一个变数 是否与某个理论分配或母群分配相符合. 同质性检定(test for homogeneity):或称 齐一性检定,检定不同母群体,在某一个变 数的反应是否具有显著差异.

分类变数卡方检定的类型 (2/2)
独立性检定(test of independence):同时 检测两个类别变数之间的关系时,其目的在 於检测从样本得到的两个变数的观察值是否 具有特殊的关联 . 多重列联表分析(multiple contingency in table Analysis):探讨三个或三个以上类别 变数之间是否具有关联(非独立)或无关 (独立).需另外购置Advanced Model,进 入Analysis→「对数线性」模组,选择其中 的「模式选择」功能来执行,故本书不拟讨 论.

适合度检定
理论或母群体的分配状况,可以统计的期望值 来表现;卡方统计原理,则是取观察值与期望 值相比较. 当卡方值愈大,代表统计量与理论值的差异愈 大,一旦卡方值大於某临界值,即可获得显著 的统计结论.
(O i - E i ) 2 2 χ2 =∑ ~ χ k -1-m Ei i =1
k

Oi:第i组样本观察次数;Ei:期望次数(或理 论次数);k:组数;m:估计之参数个数.

交叉分析表

独立性检定
其检定的卡方统计量
χ
2

=

r i =1

c j=1

∑∑

(O

ij

- E ij ) 2 E
ij

= n i. × n .j E ij :估计之理论次数,E ij n

.

各细格(Cell)之期望次数或理论次数最好不得小於 5,处理方法有细格合并法,增加样本数,去除样本 法与Yate's校正(correlation for continuity)公式. 当太多细格的次数小於5,将会造成卡方检定的偏误, 故建议最好不要分成太多细格,建议不要超过16个 细格. 的表格已是最大极限.

同质性检定
(O ij - E ij ) 2 χ 2 = ∑∑ , = (r - 1)(c - 1) df E i =1 j=1
r c ij

同质性检定是与独立性检定不同之处,在於同 质性检定系针对二个或多个独立母体分配列总 和和行总合系事先决定; 而独立性检定之列总和及行总和是随机的,而 非事先决定样本大小.

关联系数
以0至1的系数来反应类别变数之间的的关联情形, 分为底下三种的系数. χ Phi(φ)相关系数:为交叉表 的转换 . χ C列联系数:亦为列联表 的转换. Cramer's V系数:当样本数较大时,可减缓关联 系数萎缩的问题.
2 2

1. 2. 3.

φ=

x2 N

V=

x2 N(k - 1)

相关分析(Correlate) 第二节 相关分析
一,Bivatiate程序的操作步骤 二,Bivatiate程序的语句与结果输出 三,Bivatiate程序的结果制表与解释 四,Partial程序的操作步骤 五,Partial程序的结果输出与解释 六,Distances程序的操作步骤 七,Distances程序的结果输出

图1 Correlate选单 选单

Bivatiate程序的操作步骤 程序的操作步骤
「两变数相关分析」(Bivariate)程序可算出 Pearson相关系数,以及Spearman's rho与Kendall's tau-b及其显著水准.Pearson相关系数是一种线性关 联的量数. 在计算相关系数之前,请先确认其线性关系及筛选可 能会造成误差的偏离值. Pearson相关系数会假设每对变数都是常态分配. 如果资料不是常态分配,或已依类别排序,请选择 Kendall's tau-b或Spearman's rho,以便测量两个等 级排列变数之间的关联.

图2 Bivariate Correlations对话框 对话框

图3 Bivariate Correlations: Options子对话框 子对话框

遗漏值处理方式的比较
成对方式排除(Exclude cases pairwise):若成对变 数中,其中一个或两个变数有遗漏值,则分析时会排 除此观察值. 完全排除遗漏值(Exclude cases listwise):如果任 何变数的观察值中,含有遗漏值,它们就会从所有相 关系数中排除,故计算系数的有效观察值个数会最少. SPSS系统处理遗漏值的预设方法是pairwise法,这意 谓著某些变数之相关系数值会较其它变数之相关系数 值使用更多的观察值. 但listwise法只有在同一个观察值之所有变数值不是遗 漏值时,才会使用那一个观察值.

遗漏值处理范例
n 1 2 3 4 5 6 V1 12 . 16 18 . 22 V2 8 . . . 11 7 V3 . 9 23 7 33 33

若使用listwise法,只有第六笔,即只有1笔观测集被纳入分析. 若使用预设的pairwise法,则V1与V2采用第1,6笔,V1与V3采 用第3,5,6笔,V2与V3采用第5,6笔来计算相关系数.

输出结果- 图4 Bivariate输出结果-相关系数 输出结果
Correlations –秅 诀丁 1 . 15 -.816** .000 15 -.896** .000 15 -.804** .000 15 -.509 .052 15 -.816** .000 15 1 . 15 .722** .002 15 .672** .006 15 .480 .070 15

筿筿 筿筿
Pearson Correlation Sig. (2-tailed) N –秅诀丁 Pearson Correlation Sig. (2-tailed) N

筿筿筿 Θ罿
-.896** .000 15 .722** .002 15 1 . 15 .905** .000 15 .686** .005 15

筿筿筿 い Θ罿
-.804** .000 15 .672** .006 15 .905** .000 15 1 . 15 .581* .023 15

筿筿筿 ソ Θ罿
-.509 .052 15 .480 .070 15 .686** .005 15 .581* .023 15 1 . 15

筿筿筿 Θ罿

Pearson Correlation Sig. (2-tailed) N

筿筿筿い Θ罿

Pearson Correlation Sig. (2-tailed) N

筿筿筿ソ Θ罿

Pearson Correlation Sig. (2-tailed) N

**.

Correlation is significant at the 0.01 level (2-tailed).

*. Correlation is significant at the 0.05 level (2-tailed).

输出结果- 图5 Bivariate输出结果-Spearman 输出结果 等级相关系数
Nonparametric Correlations
Correlations 筿筿 1.000 . 15 -.808** .000 15 -.899** .000 15 -.812** .000 15 -.501 .057 15 –秅 诀丁 -.808** .000 15 1.000 . 15 .711** .003 15 .644** .010 15 .526* .044 15 筿筿筿 Θ罿 -.899** .000 15 .711** .003 15 1.000 . 15 .912** .000 15 .630* .012 15 筿筿筿 いΘ罿 -.812** .000 15 .644** .010 15 .912** .000 15 1.000 . 15 .543* .036 15 筿筿筿 ソΘ罿 -.501 .057 15 .526* .044 15 .630* .012 15 .543* .036 15 1.000 . 15 Spearman's rho 筿筿 Correlation Coefficient Sig. (2-tailed) N –秅诀丁 Correlation Coefficient Sig. (2-tailed) N 筿筿筿Θ罿 Correlation Coefficient Sig. (2-tailed) N 筿筿筿いΘ罿 Correlation Coefficient Sig. (2-tailed) N 筿筿筿ソΘ罿 Correlation Coefficient Sig. (2-tailed) N **. Correlation is significant at the 0.01 level (2-tailed). *. Correlation is significant at the 0.05 level (2-tailed).

具有With的Correlate的语法 的 具有 的语法
在 Bivariate的视窗介面中,只能建立一个行与列为相同变数的相 关系数矩阵. 如果想计算一组变数与另一组变数的相关系数,则必须到Syntax 视窗中输入程序指令,并用 WITH副子令来完成. 没有WITH的Bivariate程序较适用检定一组变数间的彼此相关; 但具有 WITH的Bivariate程序,则适用於两组变数间的相关. CORRELATIONS /VARIABLES=电脑能力 每周上机时间 WITH 期初成绩 期中成 绩 期末成绩 /PRINT=TWOTAIL NOSIG /MISSING=PAIRWISE .

输出结果- 图6 Bivariate输出结果-WITH副指 输出结果 副指 令

Correlations 筿筿筿 Θ罿 -.896** .000 15 .722** .002 15 筿筿筿 いΘ罿 -.804** .000 15 .672** .006 15 筿筿筿 ソΘ罿 -.509 .052 15 .480 .070 15

筿筿

Pearson Correlation Sig. (2-tailed) N

–秅诀丁

Pearson Correlation Sig. (2-tailed) N

**.

Correlation is significant at the 0.01 level (2-tailed).

Correlate的Matrix语法 的 语法
SPSS有几种不同的SPSS档案型态. 例如:CORRELATES可产生相关系数矩阵的资料档,此资料档 可以做为区别分析,因素分析,主成份分析,回归分析,MDS和 其他程序的输入. 在 CORRELATIONS加上副指令/MATRIX OUT(*) 在此档案中,有两个系统变数ROWTYPE_与VARNAME_,两者 皆为文字变数. 除了CORRELATIONS会产生相关系数矩阵外,还有 RELIABILITY,MANOVA与REGRESSION会产生N,MEAN, STDDEV,CORR值的矩阵;FACTOR会产生CORR与FACTOR 值的矩阵;PROXIMITIES,CLUSTER与ALSCAL会产生 PROX(相似性)值的矩阵等.

图7 Bivariate程序产生的相关系数矩 程序产生的相关系数矩 阵

表2 五个电脑变数间的 相关系数表

电脑能力, 表3 电脑能力,上机时间与电脑成绩 间的相关系数表

在图6-4中,电脑能力与其它变数的相关系数为负,为 何在表6-2与表6-3却变成是正的? 此乃因电脑能力之编码方式,为避免造成误解与不必 要的解释,故可以一律将负号改为正号. 电脑能力为三点的顺序尺度,严格来讲,不可以与其 它计量变数进行Pearson相关分析,不过,就使用习 惯而言,还是可将电脑能力当计量尺度,而直接与其 它计量变数进行Pearson相关分析.

结果解释与报告撰写
从表6-2可知电脑能力与上机时间高度相关,亦即可能是电脑能 力愈高的学生,愈有上机的意愿,故上机时间较多. 电脑能力及上机时间皆与期初成绩及期中成绩达显著相关,但与 期末成绩虽然是正相关,但却未达显著水准. 原来电脑能力较差与上机时间较短的同学,可以经由后天与整学 期的努力,而在期末成绩也有很好的表现. 电脑能力与期末成绩的相关系数高达.509,但为何未达显著水准, 此乃因相关系数值及显著水准与样本数有很大的关系,当样本数 高达100个以上时,相关系数值会变小,但这并不表示其相关程 度变小,此时,相关系数只要.200以下,就有可能达到.05的显 著水准.

图8 Partial Correlations 对话框

图9 Partial程序输出结果 程序输出结果
Correlations –秅 诀丁 –秅诀丁 Correlation Significance (2-tailed) df 1.000 . 0 -.039 .895 12 .046 .875 12 .128 .662 12 Control Variables

筿筿筿 Θ罿
-.039 .895 12 1.000 . 0 .700 .005 12 .601 .023 12

筿筿筿 いΘ罿
.046 .875 12 .700 .005 12 1.000 . 0 .334 .243 12

筿筿筿 ソΘ罿
.128 .662 12 .601 .023 12 .334 .243 12 1.000 . 0

筿筿

筿筿筿Θ罿

Correlation Significance (2-tailed) df

筿筿筿いΘ罿

Correlation Significance (2-tailed) df

筿筿筿ソΘ罿

Correlation Significance (2-tailed) df

当把电脑能力当作控制变数时,可知上机时间与期初 成绩,期中成绩,期末成绩三者皆变成没有显著相关, 故上机时间就没有解释能力了.

Distances程序的操作步骤 程序的操作步骤
距离(Distances)程序可用来计算两个体间的距离, (此可做为第十章集群分析与第十一章多元尺度法的 输入资料).

图10 Distances对话框

图11 Distances: Dissimilarity Measures子对话框 子对话框

图12 PROXIMITIES程序输出的观察 程序输出的观察 值距离矩阵
Proximity Matrix Euclidean Distance 1:朝 1:朝 2:狶 3:眎 4: 5:き 6:化せ 7: 8:法 9:独 10:谅 11:腑κ 12:バ 13:窾 14:货 15:窥 .000 20.809 45.177 30.529 32.527 20.000 13.601 33.615 15.524 19.105 10.630 6.000 38.833 5.000 31.623 2:狶 20.809 .000 24.698 9.849 12.530 6.403 13.038 13.000 8.246 4.472 10.770 18.028 18.028 16.125 10.817 3:眎 45.177 24.698 .000 14.866 17.117 28.443 36.878 11.705 30.232 27.893 35.468 42.720 8.062 40.719 14.318 4: 30.529 9.849 14.866 .000 7.616 14.000 22.204 3.162 16.279 13.153 20.616 27.857 8.485 25.942 2.000 5:き 32.527 12.530 17.117 7.616 .000 13.038 21.471 8.485 20.616 13.454 21.932 28.601 9.055 27.586 5.831 6:化せ 20.000 6.403 28.443 14.000 13.038 .000 8.544 17.029 12.369 2.236 9.434 15.620 20.881 15.000 14.142 7: 13.601 13.038 36.878 22.204 21.471 8.544 .000 25.318 14.213 9.055 5.831 8.062 29.411 9.055 22.561 8:法 33.615 13.000 11.705 3.162 8.485 17.029 25.318 .000 19.105 16.279 23.770 31.016 5.831 29.069 3.162 9:独 15.524 8.246 30.232 16.279 20.616 12.369 14.213 19.105 .000 10.198 8.944 15.133 24.759 12.000 17.804 10:谅 19.105 4.472 27.893 13.153 13.454 2.236 9.055 16.279 10.198 .000 8.485 15.264 20.616 14.142 13.601 11:腑κ 10.630 10.770 35.468 20.616 21.932 9.434 5.831 23.770 8.944 8.485 .000 7.280 28.653 5.657 21.471 12:バ 6.000 18.028 42.720 27.857 28.601 15.620 8.062 31.016 15.133 15.264 7.280 .000 35.777 3.606 28.636 13:窾 38.833 18.028 8.062 8.485 9.055 20.881 29.411 5.831 24.759 20.616 28.653 35.777 .000 34.132 7.211 14:货 5.000 16.125 40.719 25.942 27.586 15.000 9.055 29.069 12.000 14.142 5.657 3.606 34.132 .000 26.926 15:窥 31.623 10.817 14.318 2.000 5.831 14.142 22.561 3.162 17.804 13.601 21.471 28.636 7.211 26.926 .000

This is a dissimilarity matrix

图13 PROXIMITIES程序输出的变数 程序输出的变数 距离矩阵
Proximity Matrix Euclidean Distance ō蔼 砰 ō蔼 .000 409.527 砰 409.527 .000

This is a dissimilarity matrix

在图10中,除可计算Cases间距离,也可计算变数 间距离. 如勾选Between Variables,则可得到图13的结果输 出.

第三节 相关分析范例
一,「规模」与「CRM实施程度」的相关分 析 二,个人基本资料与3GL行动通讯之关系 三,治安满意度之影响因素研究

表4 四个规模变数间的 相关系数表

七个CRM互动实施 表5 七个 互动实施 程度变数间的相关系数表

影响因素与CRM互动介面实施程 表6 CRM影响因素与 影响因素与 互动介面实施程 度关系之检定分析表

这表示企业规模愈大,则愈有资源投入於CRM的 导入,CRM互动介面的实施程度愈高.

表7 计量的个人基本资料与关键因素及 采用意愿的相关分析表

相关分析的结果解释
年龄层愈轻者对於采用意愿的各项关键因素愈积极. 在教育程度对采用意愿的关键因素方面的影响,均未 达显著水准. 在年收入对个人的创新影响达显著水准且为负相关. 年龄愈长者大部分薪水较高,对於个人的创新较不讲 究.在年收入对公司补助与否方面,大部分年收入较 少者属愈年轻,愈希望公司能补助其手机帐单费用. 年收入较高者大部分年龄较大,对於3G科技产品的采 用意愿较低.

治安满意度之影响因素研究
满意度与居民数及全般刑案为负相关,且达显著水准, 满意度也与强盗犯罪率与抢夺犯罪率虽然未达到显著 相关,但有负相关的现象 台北县,桃园县,台中市,台北市,高雄市及高雄县 等六县市强盗案件发生数占台闽地区总数56.09%,显 示人口较多及都市化较高之县市,强盗案件较多. 故这六个县市的居民对治安相当不满意,特别是台中 市与台北县. 治安满意度与刑案破案率与警政支出占政府支出比率 达显著正相关,这表示警政单位如果能加强破案率还 是能提升治安满意度.

表8 治安满意度与影响因素之相关分 析表

第四节 SPSS的Crosstabs分析 的 分析
利用「交叉表」(Crosstabs)程序,形成二因子和多 因子的交叉分析表格,并为二因子表格提供数种检定 和关联测量. Crosstabs程序最适合用来计算分类或名目变数的交叉 表,以及变数间关联之计算. 计量变数最好能事先转换为分类变数(使用 COMPUTE或RANK),再进行Crosstabs程序. 第四章的次数分配表(Frequencies)程序可用於资料 输入或编码的错误的检查. 有时采用次数分配表亦可能无法发现资料输入错误, 但却可以用列联表找出来.例如:性别变数(男,女) 与怀孕变数(是,否),两变数之列联表不应该出现男 性怀孕的现象.

图18 Crosstabs对话框 对话框

图19 Crosstabs: Cell Display子对话 子对话

图20 Crosstabs: Statistics子对话框 子对话框

如果表格中只有两个列和两个行,选择卡方检定后, 可计算Pearson卡方值,概似比卡方值,Fisher's精确 检定(Exact text),以及Yates'修正卡方检定.

21Crosstabs: Table Format子对话 子对话 框

交叉分析表
┦ * 筿筿 Crosstabulation
筿筿 excellent ┦ girl Count Expected Count % within ┦ % within 筿筿 % of Total Residual Std. Residual Adjusted Residual boy Count Expected Count % within ┦ % within 筿筿 % of Total Residual Std. Residual Adjusted Residual Total Count Expected Count % within ┦ % within 筿筿 % of Total 0 2.3 .0% .0% .0% -2.3 -1.5 -2.6 5 2.7 62.5% 100.0% 33.3% 2.3 1.4 2.6 5 5.0 33.3% 100.0% 33.3% good 4 2.8 57.1% 66.7% 26.7% 1.2 .7 1.3 2 3.2 25.0% 33.3% 13.3% -1.2 -.7 -1.3 6 6.0 40.0% 100.0% 40.0% bad 3 1.9 42.9% 75.0% 20.0% 1.1 .8 1.3 1 2.1 12.5% 25.0% 6.7% -1.1 -.8 -1.3 4 4.0 26.7% 100.0% 26.7% 15 15.0 100.0% 100.0% 100.0% 8 8.0 100.0% 53.3% 53.3% Total 7 7.0 100.0% 46.7% 46.7%

统计量与卡方检定结果

相关系数的计算与检定(1/2)
Symmetric Measures Asymp. a Std. Error
b

Value Nominal by Nominal Interval by Interval Ordinal by Ordinal N of Valid Cases a. Not assuming the null hypothesis. Phi Cramer's V Pearson's R Spearman Correlation .665 .665 -.600 -.609 15

Approx. T

Approx. Sig. .036 .036

.175 .182

-2.706 -2.766

.018c .016c

b. Using the asymptotic standard error assuming the null hypothesis. c. Based on normal approximation.

相关系数的计算与检定(2/2)
性别与电脑能力分别为名目与顺序尺度,故选择 Correlations是不恰当的做法,但为了让读者了解不同 统计量间的异同,特别做此比较. 当把性别与电脑能力皆视为计量尺度时,所计算出的 Pearson相关系数为-.600和Spearman等级相关系数 为-.609. 但事实上,您绝对不能以相关系数来解说性别与电脑 能力呈负相关现象,而是要以交叉分析表的卡方来检 定,两者不是负「相关」,而是有「关联」现象. 虽然在本表中也显示相关系数达显著水准,但绝对不 能选用Correlations来当作两个计质变数间关联程度的 衡量.

结果解释与报告撰写
若卡方值达显著水准,还需交代各细格Row%或 Column%与合计的比较,千万不要只说明每个细格的 次数,而是要说明%与全部样本%的比较才对. 本范例卡方值为6.629达.05的显著水准,从合计的 Row%显示,全部样本中,电脑能力优,好与坏的比 率分别为33.3%,40.0%与26.7% . 但从男与女的Row%显示,女性中电脑能力优的比率 为0%远低於平均比率33.3%,男性却高达62.5%远高 於平均比率33.3%. 此结果显示,性别与电脑能力两者间确实有关联 .

表9 性别与看法的交叉分析表

第五节 两变数关联分析原理
一,民意调查的交叉分析 二,个人基本资料对3G行动手机考虑原则的 影响 三,居住地区与信件寄回的交叉分析 四,产业别与CRM导入的交叉分析

Crosstabs的应用范例 的应用范例
通常在学术研究中,Total%并不需要列出,且Row% 或Column%只要选择其中一个来展示即可,因为任何 表格的Row与Column变数皆可互换,所以无法得到选 择Row%或Column%的通用规则. 至於要何时列出Row%或Column%,则以两个变数的 性质而定,如果两变数之一是在实验的控制之下,则 称为预测变数(A),假设此预测变数会引起另一变 数的反应,则另一变数称为准则变数(B). 若A变数是Row变数,则选用Row%;若A变数是 Column变数,则选用Column%百分比.

一,民意调查的交叉分析
这些民调中心对外公布的数据,其所用的统计方法皆 相当简单,主要可分为两种,第一种是第四章的次数 分配表,第二种即为本章本节所探讨的交叉分析表. 例如探讨政党倾向(分为泛蓝,中立,泛绿三种)与 护渔事件(分为赞成,反对,不知道/无意见)的交 叉分析,政党倾向与加税,政党倾向与两岸直航 . 上述皆是典型的叉交分析表应用,且往往只公布调查 的有效样本及每个交叉表细格的百分比而不是人数. 此乃因Crosstabs的卡方检定原理,主要是看百分比而 不是人数.民调中心也不会公布卡方检定的结果.

溜鸟侠- 溜鸟侠-性别
在TVBS的调查中,将对此一事件的看法分为「处罚 太轻,处罚太重,刚刚好,不知道」四种,结果显示 有77%认为处罚太重,15%认为刚刚好,3%认为太轻, 5%不知道. 在本范例中,欲探讨性别对看法的影响,故预测变数 A是性别,准则变数B是看法.由於A为Row变数,故 於表6-10中,只要列出Row变数即可. 表6-10的卡方值的Sig.值.068,已达.1的显著水准. 交叉分析表显示女性认为处罚过重的比率较男性为高 (80.6%对73.7%) .

表10 性别与看法的交叉分析表

溜鸟侠- 溜鸟侠-年龄层
闹闹 * 猭 Crosstabulation
猭 矪矪び淮 闹 闹 20-29烦 30-39烦 40-49烦 50-59烦 60烦 Total Count % within 闹闹 Count % within 闹闹 Count % within 闹闹 Count % within 闹闹 Count % within 闹闹 Count % within 闹闹 2 1.0% 4 2.1% 4 2.1% 5 4.1% 8 4.9% 23 2.6% 矪矪び 168 82.8% 157 81.3% 149 77.2% 90 73.2% 111 67.7% 675 77.1% 30 14.8% 29 15.0% 31 16.1% 22 17.9% 21 12.8% 133 15.2% ぃ笵 3 1.5% 3 1.6% 9 4.7% 6 4.9% 24 14.6% 45 5.1% Total 203 100.0% 193 100.0% 193 100.0% 123 100.0% 164 100.0% 876 100.0%

表11 年龄层与看法的交叉分析表 表11的卡方值为50.434,Sig.值为.000,已达.01的显 著水准,表示年龄确实会影响看法.

两岸直航态度调查
坝坝 * 猭 Crosstabulation
猭 坝 坝 Τ ⊿Τ Total Count % within 坝坝 Count % within 坝坝 Count % within 坝坝 莱莱 159 55.2% 281 49.0% 440 51.1% ぃ莱莱 92 31.9% 160 27.9% 252 29.3% ぃ笵 37 12.8% 132 23.0% 169 19.6% Total 288 100.0% 573 100.0% 861 100.0%

表12 是否有台商家人与两岸直航看法的交叉分析表. 表12的卡方值为12.624,Sig值为.002,已达.01的显 著水准,表示在大陆是否有家人会影响对两岸直航的 看法.

性别,婚姻与3G手机考虑原则 表13 性别,婚姻与 手机考虑原则 的交叉分析表

二,个人基本资料对3G行动手机考虑 个人基本资料对 行动手机考虑 原则的影响(1/2)
若将性别与婚姻当作预测变数A,因其为 Column变数,故以Column%来说明. 男性考虑「经济性」的比率(38.3%)略低於 平均值,考虑「多功能性」的比率(53.4%) 略高平均值,但整体而言,未达显著水准. 在婚姻方面,未婚者对「多功能性」的比率高 於平均值,故卡方检定达显著水准. 这表示已婚者比较理性,重视的经济性,未婚 者追求的是感性,更强调多功能性.

二,个人基本资料对3G行动手机考虑 个人基本资料对 行动手机考虑 原则的影响(2/2)
若将性别与婚姻当作准则变数B,因其为Column变数,故以 Row%来说明. 在本次调查样本中,在经济性原则上,男性与女性的比率分别为 45.1%与54.9%,男生及女性的人数比率分别为48.7%与51.3%, 各有3.6%的差距;在多功能性上,男性与女性的比率分别为 51.0%与49.0%,与男生及女性的人数比率各有2.3%的差距. 同理,在跟随流行上,未婚与已婚的比率分别为63.8%与36.2%, 与总未婚与已婚的人数比率各有高达11.7%的差距. 故整体而言,婚姻与考虑原则达显著水准,这表示已婚者较未婚 者更重视经济性,而未婚者则较已婚者重视跟随流行.

三,居住地区与信件寄回的 交叉分析
以「遗失信件技术」进行实证研究. 此研究认为,除非需要帮助的人是社会上的歧异份子, 否则小乡镇居民比大城市居民的利他观念为高. 这项技术是将贴好邮票,写好地址的信件故意「遗 失」,然后看看信件被寄回的比率. 这些信件寄给三个虚构的人物转M. J. Davis,转粉红 豹游乐厅,转黑手党的朋友们. 第一个人是正常的「控制组」(Control);第二个人 的职业有问题;而第三个人则是影响社会治安的黑社 会份子.

表14 寄回情况与信封地址的交叉分 析表
盚 薄 薄 * 獭 Crosstabulation
獭 北舱 盚 薄薄 琌 Count % within 盚薄薄 % within 獭 Count % within 盚薄薄 % within 獭 Total Count % within 盚薄薄 % within 獭 35 45.5% 48.6% 37 26.6% 51.4% 72 33.3% 100.0% 笴笴笴 32 41.6% 44.4% 40 28.8% 55.6% 72 33.3% 100.0% 堵も囊 10 13.0% 13.9% 62 44.6% 86.1% 72 33.3% 100.0% Total 77 100.0% 35.6% 139 100.0% 64.4% 216 100.0% 100.0%

结果解释
表14为不分居住地区的交叉分析表,卡方检定结果达 显著水准,这表示信封地址对寄回情况有显著的关系. 表15由卡方检定结果显示,都市与乡镇间具有非常有 趣的差异,虽然全面的寄回率两者相近(都市36.1%, 乡镇35.2%),但在收信地址间却有令人惊讶的差异. 居住在乡镇的人民,对於黑手党的信只有2.8%被寄回, 而居住在都市里竟达25.0%.在乡镇里控制组与游乐 厅的寄回率均较都市为高. 检定结果表示,居住在都市者,信封地址并不会影响 其寄回率,但居住在乡镇者,信封地址会显著影响其 寄回率.

表15 分居住地区的寄回情况与信封地 址的交叉分析表
盚薄薄 * 獭 * *跋跋 Crosstabulation 獭 *跋跋 常カ 北舱 盚 薄薄 琌
Total Count % within 獭 Count % within 獭 Count % within 獭 16 44.4% 20 55.6% 36 100.0% 19 52.8% 17 47.2% 36 100.0%

笴笴笴
14 38.9% 22 61.1% 36 100.0% 18 50.0% 18 50.0% 36 100.0%

堵も囊
9 25.0% 27 75.0% 36 100.0% 1 2.8% 35 97.2% 36 100.0%

Total 39 36.1% 69 63.9% 108 100.0% 38 35.2% 70 64.8% 108 100.0%

秏秏

盚 薄薄



Count % within 獭 Count % within 獭 Count % within 獭

Total

产业别与是否导入CRM的交叉 表16 产业别与是否导入 的交叉 分析表
狝狝┪籹 籹 * 琌旧 Crosstabulation 琌旧 竒旧 狝狝 ┪籹 籹 籹籹籹 狝狝籹
Count % within 狝狝┪籹籹 Count % within 狝狝┪籹籹 Total Count % within 狝狝┪籹籹 7 26.9% 14 29.8% 21 28.8%

タ砏砏い
0 .0% 7 14.9% 7 9.6%

タ蝶
11 42.3% 15 31.9% 26 35.6%

#ゼ蝶
8 30.8% 11 23.4% 19 26.0%

Total 26 100.0% 47 100.0% 73 100.0%

此表显示在服务业中,已经导入CRM的比率略高於制 造业,且正规划中的比率亦远高於制造业. 故服务业中,正在评估与尚未评估CRM的比率低於制 造业,即服务业在CRM导入的进度上较制造业为高.

2. 相关分析
壹,连续变项之相关系数: Pearson 积差 相关 贰,质化变项之相关系数

本单元将介绍如何判断变数间之相关性, 本单元将介绍如何判断变数间之相关性,包括相 关程度大小与方向.各种分类如下: 关程度大小与方向.各种分类如下: 依变数个数区分
– –

简单相关:讨论二个变数间的关系 复相关:三个以上变数间的关系 线性相关:变数间关系可用直线函数表示 非线性相关:曲线相关(指数,乘积) 完全相关:变数间可用函数表达 (γ=±1) 零相关:变数间不具任何关系 (γ=0) 非完全相关:介於上述之间

依线性性质区分
– –

依相关程度区分
– – –

连续变项之相关系数: 连续变项之相关系数 Pearson 积差相关 1/3
两变项间之关系 干扰变项下之关系

连续变项之相关系数: 连续变项之相关系数 Pearson 积差相关 2/3
两变项间之关系 若两变数均属於连续的量化资料,则两变数间 之相关性,适合以Pearson 积差相关系数来衡 量.
– –

范例一 探讨全校成绩中,智力测验与数学成绩之相关性.

范例一
建立假说
– –

H0:智力测验成绩与数学成绩无关(ρ=0) H1:智力测验成绩与数学成绩有关(ρ≠0) 绘图Graphs → Scatter → Simple 设定变数(X轴, y轴) Analyze →Correlate → Bivariate出现对话框:(a)设 定变数(Variables)(b)勾选 Pearson(c)设定双尾或 单尾检定

程式操作




分析结果

范例一
2.程式操作

范例一― 范例一―分析结果
Correlations

智智智智 智智智智
Pearson Correlation 1 Sig. (1-tailed) . N 230 数数数智智智 Pearson Correlation .901** Sig. (1-tailed) .000 N 230 **. Correlation is significant at the 0.01 level (1-tailed).

数数数智智智
.901** .000 230 1 . 230

Pearson相关系数=0.901,Sig=0.000<0,因此拒绝H0. 结论:智力测验与数学成绩有显著之正相关.

连续变项之相关系数: 连续变项之相关系数: Pearson 积差相关 3/3
干扰变项下之关系 两连续变项间之关系可能受到其他变项的干扰, 而扭曲两变项间真正的关系.净相关亦可称为偏 相关,即在计算两个连续变项X1与X2的相关之时, 将第三变项(X3)与两个相关变项的相关r13与 r23予以排除之后的纯净相关,以r12.3来表示.


范例二 针对银行客户,探讨「存款」与「贷款」之相关性是 否受「所得」的影响.

范例二
整体相关系数


– –

点选Analyze →Correlate → Bivariate出现对话 框:(a)设定变数(Variables)(b)勾选 Pearson(c)设定 双尾或单尾 所所 存存 贷存 检定 所所 程式操作 存存 结果: 贷存
Correlations Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N **. Correlation is significant at the 1 .948** . .000 199 199 .948** 1 .000 . 199 199 .974** .871** .000 .000 199 199 0.01 level (2-tailed). .974** .000 199 .871** .000 199 1 . 199

范例二 -1
2.程式操作

范例二
存款与贷款之净相关


– –

1.点选Analyze →Correlate → Partial出现对话 框:(a)设定变数(Variables)(b)勾选 Pearson(c)设定 双尾或单尾检定 2.程式操作 3.分析结果

范例二 -2
2.程式操作

范例二― 范例二―分析结果

结论:未排除所得效果时,存款与贷款间之相关系数为0.871; 排除所得效果后之净相关系数为-0.7344.显然地,存 款与贷款之相关性深受所得影响.

质化变项之相关系数 1/3
1.Phi相关:适用於两个变项均为二分法之名 目变项(例如:性别) . 2.Cramer's V:为名目变数相关性最常用的指 标.当用於2×2的列联表时,V值与Phi值相同, 而ㄧ般Cramer's V多用於比2×2大的列联表. 3.Contingency coefficient(列联相关系数):为 改良Phi以用於大於2×2列联表所设计之相关系 数值.

质化变项之相关系数 2/3
4.Eta相关:如果两个变数中ㄧ个是名目尺度, 另ㄧ个为连续变数由不同数值区间所订出的区 间尺度(例如依年龄分为四组),则选用Eta值. 5.McNemar相关:用於重复试验时,比较前 后的差异性是否明显.


(范例三)

范例三
探讨银行客户之信用等级与居住区域之相关性.


建立假说
H0: 信用等级与居住区域无关 H1: 信用等级与居住区域有关





程式操作: 点选Analyze/Descriptive Statistics/Crosstable 分析结果

范例三
2.程式操作

范例三―分析结果 范例三 分析结果

Symmetric Measures Value .124 .088 199 Approx. Sig. .547 .547

Nominal by Phi Nominal Cramer's V N of Valid Cases a. Not assuming the null hypothesis. b. Using the asymptotic standard error assuming the null hypothesis.

结果: sig=0.547>0.05,无法拒绝H0,所以信用等级 与居住区域无关.

质化变项之相关系数 3/3
6.点对二元系列相关(Point-Biserial Correlation):一变数属於类别特性资料,另一 变数则为比率或等距之计量变数. 7.斯皮尔曼等级相关(Spearman rank-order correlation):应用於顺序变项线性关系之描述, 当两个变数中有任一变数或两个变项都是次序 变项的资料时. 8.肯德尔系数(Kendall's Tau Coefficient):原 理同斯皮尔曼等级相关,但适用於样本数较少 时之状况(N5).

相关文章:
SPSS相关分析案例讲解
SPSS相关分析案例讲解_计算机软件及应用_IT/计算机_专业资料。相关分析一、两个变量的相关分析:Bivariate 1.相关系数的含义 相关分析是研究变量间密切程度的一种常用...
基于SPSS的相关分析
Xxxx 数学系 20xx 级 统计学专业 统计分析软件课程论文 基于 SPSS 的相关分析 xxx (123456789123) 摘要: 相关分析分析客观事物之间关系的数量分析方法, 是用来...
如何在SPSS中实现典型相关分析
如何在SPSS中实现典型相关分析_计算机软件及应用_IT/计算机_专业资料。如何在 SPSS 中实现典型相关分析? SPSS 11.0 15.1 典型相关分析 15.1.1 方法简介 在...
SNP关联分析SPSS流程
SNP关联分析SPSS流程_信息与通信_工程科技_专业资料。1. 数据格式:将个体的生长性状(体重,体长等)与个体基因型数据导入 Excel,建立文 档。如图: 2. 导入 SPSS...
SPSS相关分析案例讲解
SPSS 相关分析案例讲解 一、两个变量的相关分析:Bivariate 1.相关系数的含义 相关分析是研究 变量间密切程度的一种常用统计方法。相关系数是描述相关 关系强弱程度和...
SPSS相关性分析 Pearson相关与偏相关分析的实现 步骤
SPSS 相关性分析 Pearson 相关与偏相关分析的实现步骤 一、 Pearson 相关分析 二、 偏相关分析方法一正规步骤,但是麻烦 1、分析——相关——偏相关。 2、选择...
SPSS皮尔逊相关分析实例操作步骤
SPSS皮尔逊相关分析实例操作步骤_计算机软件及应用_IT/计算机_专业资料。SPSS相关分析 SPSS皮尔逊相关分析实例操作步骤选题: 对某地29名13岁男童的身高(cm)、体重(kg...
用SPSS做相关性分析的入门操作步骤
SPSS做相关性分析的入门操作步骤_社会学_人文社科_专业资料。自变量是连续变量,因变量是连续变量,怎么做相关性分析?自变量是分类变量,因变量是连续变量,怎么做相关...
spss相关性分析报告
打开 SPSS 软件,建立产量、降雨量、温度的实验数据,如图 2 .选择菜单: 【分析】→【相关】→【偏相关】 ,将“产量”和“降雨量”选入“变量”框中,“温度”...
SPSS中的相关分析及假设检验
SPSS中的相关分析及假设检验_理学_高等教育_教育专区。SPSS应用中与相关分析有关的常用方法介绍。。。今日推荐 78份文档 不小心又胖了 胖女人必看 ...
更多相关标签: