当前位置:首页 >> 高中教育 >>

EXCEL均数差异显著性检验


第四章 均数差异显著性 检验 — t检验
河南农业职业学院 孙攀峰

目的要求
?

?

显著性检验的目的、 方法以及步骤 Excel进行t检验的步 骤、方法

第一节 概率及分布概述

一、事件
定义:在一定条件下,某种事物出现与否 就称为是

事件。

自然界和社会生活上发生的现象是各 种各样的,常见的有两类。

一、概率基本概念

在一定条件下必然出现某种结果或必然不出现某种结果。

确定性事件

必然事件(U) (certain event)

不可能事件(V) (impossible event)

在一定条件下可能发生也可能不发生。

随机事件(random event) 不确定事件(indefinite event) 为了研究随机现象,需要进行大量重复的调查、实验、 测试等,这些统称为试验。

二、频率(frequency)
若在相同的条件下,进行了n次试验,在这n 次试验中,事件A出现的次数m称为事件A出现的 频数,比值m/n称为事件A出现的频率(frequency), 记为W(A)=m/n。

0≤W(A) ≤1

抛掷一枚硬币发生正面朝上的试验记录

实验者
蒲峰 皮尔逊 皮尔逊

投掷次数 ( n)
4040 12000 24000

发生正面朝上次数 频率 ( m) (m/n)
2048 6019 12012 0.5069 0.5016 0.5005

从表中可以看出,试验随着n值的不同,正面朝上出现 的频率也不相同,当n越大时,频率越接近0.50。

一、概率基本概念

频率表明了事件频繁出现的程度,因而其稳定
性说明了随机事件发生的可能性大小,是其本身固 有的客观属性,提示了隐藏在随机现象中的规律性。

定义:设在相同的条件下,进行大量重复试验, 若事件A的频率稳定地在某一确定值p的附近摆动, 则称p为事件A出现的概率。

P(A) = p

统计概率

抛掷一枚硬币发生正面朝上的试验记录 实验者 蒲丰 K 皮尔逊 K 皮尔逊 投掷次数 4040 12000 24000 发生正面朝上的次数 2048 6019 12012 频率(m/n) 0.5069 0.5016 0.5005

随着实验次数的增多,正面朝上这个事件发生的频率稳定 接近0.5,我们称0.5作为这个事件的概率。

三、概率(probability,P)
m m P(A) = p=lim ? n n
在一般情况下,随机事件的概率P是不可 能准确得到的。通常以试验次数n充分大,随 机事件A的频率作为该随机事件概率的近似值。

1

2

3

4

5

6

7

8

9

10

随机抽取一个球,求下列事件的概率; (1)事件A=抽得一个编号< 4 (2)事件B =抽得一个编号是2的倍数

该试验样本空间由10个等可能的基本事件构成,即n=10,而 事件A所包含的基本事件有3个,即抽得编号为1、2、3中的任 何一个,事件A便发生。 P(A)=3/10=0.3 P(B)=5/10=0.5

一、概率基本概念 1 6 2 7 3 8 4 9 5 10

A=“一次取一个球,取得红球的概率”

10个球中取一个球,其可能结果有10个基本事件(即每个球 被取到的可能性是相等的),即n=10 事件A:取得红球,则A事件包含3个基本事件,即m=3 P(A)=3/10=0.3

四、小概率事件原理
概念: 如果某事件发生的概率很小,在大量 重复试验中事件发生的频率也很小, 在1次试验中该事件被看做是不会发 生的。 应用:是假设检验时进行统计推断的理论依据。
通常将5%,1%认为是小概率的标准,又称 显著水平。

第二节 均数差异显著性检验

一、复习回顾
生物统计的本质: 研究如何从样本推断总体 样本抽取的原则: 随机抽样 试验误差的概念: 由样本推断总体时,由各种 无法控制的随机因素引起的误差。

现在,我们假设有这样一个情况: 从一批同质(相同品种、相同日龄、 相同饲料、相同饲养管理等)的20000 只肉 鸡中随机抽取各含 100只肉鸡的两个样本, 分别称量其42天出栏重,结果发现: 样本1平均出栏重为:2.24kg/只 样本2平均出栏重为:2.31kg/只
两样本来自同一总体,但二者 的样本平均数却存在一定差异

这种差异来源于随机抽样

造成的随机误差!

现在,我们再来看另一种情况:
在相同日龄、相同饲料、相同饲养管理等条件 下,随机从两个品种(AA肉鸡、艾维因肉鸡)的 各10000只肉鸡中分别抽取100只肉鸡做为样本, 称量其42天出栏重,结果发现: AA 肉鸡平均出栏重为:2.31kg/只 艾维因肉鸡平均出栏重为:2.24kg/只 品种本质差 异 随机误差

差异

在试验进行过程中,尽管尽量排除随机误差的影响,以 突出试验的处理效应,但由于生物个体间无法避免的差异, 以及诸多无法控制的随机因素,使得试验结果最后表现的观 察值除了处理效应以外,还包括试验误差的效应。

处理 效应 误差 效应

表 面 效 应

二、显著性检验的目的
对两个样本进行比较时,必须判断样本 间差异主要是随机误差造成的,还是本质不 同或处理效应引起的?
处理 效应 误差 效应

显 著 性 检 验

表 面 效 应

显 著 性 检 验

处理 效应 误差 效应

三、显著性检验的任务
分析误差产生的原因 排除误差干扰
确定差异的性质 对总体特征做出正确判断

四、显著性检验的原理
小概率原理:
统计假设:对总体的某些未知或不完全知道
的性质提出待考查的命题,通常包括无效假 设和备择假设。根据样本资料对假设的成立

与否进行推断就是假设检验,也称显著性检
验。

五、显著性检验的分类
t 检验——主要用于检验两个处理平均数
差异是否显著; 方差分析——主要用于检验多个处理平均 数间差异是否显著;

检验 —— 主要用于由质量性状得来的次
数资料的显著性检验等。

六、显著性检验的步骤
1、提出假设
2、确定显著水平 3、选定检验方法,计算检验统计量, 确定概率值作出推断 4、结论:是否接受假设

下面以两均数差异显著性检验为例具体说 明操作步骤。
例1: 随机抽测9头内江猪和9头荣昌猪经产母猪的产仔 数,得到如下数据资料:
产仔数 内江猪 荣昌猪 14 12 15 14 12 13 11 13 13 12 17 14 14 10 14 10 13 10

试比较内江猪与荣昌猪两品种经产母猪产仔数 是否存在显著差异。

1 、提出假设
无效假设 /零假设 /检验假设

H0 误差 效应

?1 = ?2

对 立

备择假设 /对应假设

?1 ? ?2 HA

处理 效应

例:比较内江猪与荣昌猪两品种经产母猪产仔数 是否存在显著差异。

? 提出假设:
(1)无效假设H0: ?1 = ?2
即假设两品种经产母猪产仔数的总体平均数相等, 试验的处理效应(品种间差异)为0。

即假设两品种经产母猪产仔数的总体平均数?1 和?2 不相等,亦即存在处理效应,其意义是指两品种经产母 猪产仔数存在本质上的差异。

(2)备择假设HA : ?1 ≠?2

2 、 确定显著水平
能否定H0的人为规定的概率标准称为显著水平,记作?。

统计学中,一般认为概率小于0.05或0.01的事件 为小概率事件,所以在小概率原理基础上建立的假设 检验也常取?=0.05和?=0.01两个显著水平 。

?=0.05 ?=0.01
P< ?

显著水平* 极显著水平**

3 、选定检验方法,计算检验统计量,确定概率值 根据研究设计的类型和统计推断的目的选 择使用不同的检验方法。 例: ? 这里是对两品种经产母猪产仔数的总体
平均数进行比较,因此为均数差异显著性检 验------t检验。

在无效假设H0成立的前提下计算t值

注:由于计算过程复杂,这里不再重复书上内容,在下 面将具体讲解如何用Excel来进行统计分析。

Excel进行t检验分类
Excel可提供的t检验工具:
?

t-检验:双样本等方差假设
此 t-检验先假设两个数据集取自具有相同方差的分布,可确定两个样本 是否来自具有相同总体平均值的分布。

?

t-检验:双样本异方差假设
此 t-检验先假设两个数据集取自具有不同方差的分布,可以确定两个样本是否来 自具有相同总体平均值的分布。当两个样本中有截然不同的对象时,可使用此检验。

?

t-检验:平均值的成对二样本分析
当样本中存在自然配对的观察值时(例如,对一个样本组在实验前后进 行了两次检验),可以使用此成对检验,以确定取自处理前后的观察值是否 来自具有相同总体平均值的分布。

Excel进行t检验步骤(一)
输入数据

Excel进行t检验步骤(二)
“工具” 验” “数据分析” “t检

这里假设无效假 设Ho成立,即两 品种无差异,二者 来自同一总体,则 为“双样本等方差 假设”。

Excel进行t检验步骤(三)
拉取两品种数据

显 著 水 平

假设Ho成立,则 平均差为0. “内江猪”“荣昌猪”做为 标志拉取在上面的变量区域 中

结果输出区域,可选 任一空白单元格

Excel进行t检验步骤(四)

计算所得t值 双尾概率P

4、作出推断结论:是否接受假设

小 概 率 原 理

P>?

假设H0成立 可能正确

接受H0 否定HA 否定H0 接受HA

P< ?

假设H0成立 可能错误

例:上例中 P=0.053>0.05

所以接受H0,从而得出结论:内江猪与
荣昌猪经产母猪产仔数未发现有显著差

异,其表面差异应有大于5%的概率归于
随机误差所致。

假设检验的步骤:

分 析 题 意

提 出 假 设

确 定 显 著 水 平

计 算 检 验 统 计 量

作 出 推 断

七、显著性检验两种类型错误

显著性检验的两类错误
H0正确 否定H0 接受H0 ?错误(?) 推断正确(1-?) H0 错误 推断正确(1-?) ?错误(?)

第一类错误(type I error),又称弃真错误或? 错误; 第二类错误( type II error ) ,又称纳伪错误或? 错误

1、 两类错误既有联系又有区别
?错误只在否定H0时发生

?错误只在接受H0时发生
?错误增加 ? 错误减小 ?错误增加 ? 错误减小

2、 ?还依赖于 ?- ?0 的距离

3、n , ?2 可使两类错误的概率都减小.

八、样本均数与总体均数 差异显著性检验

样本均数与总体均数差异显著性检验?t检验
无效假设为Ho:???o

备择假设为HA:???o
计算公式如下:

根据以上公式可导出以下结论:

由此可知,当总体平均数落在已知的样本均数置 信概率为(1-?)的置信区间以外时,就表明在?显著 水平时差异显著。

例5.2:母猪的怀孕期为114d,现抽测12头大白猪母猪的怀孕期分别
为115,113,114,112,116,115,114,118,113、115、114、113,试 检验所得样本的平均数与总体平均数114d有无显著差异?

第一步, 输入数据

第二步,工具---数据分析---描述统计

第三步,输入参数

第四步,计算结果
95%置信区间 下限:114.3333-1.025696=113.3 上限:114.3333+1.025696=115.4

总体平均数: 114d
分析:总体平均数落在样本均数置 信概率为95%的置信区间内(113.3 ~115.4),说明样本均数与总体均 数差异不显著。

九、两个样本平均数的差异显著性检验

试 验 设 计

非配对试验设计
成组数据平均数的比较

配对试验设计
成对数据平均数的比较

非配对试验—成组数据平均数的比较
试验单位完全随机地分两组,各实施一试验处理, 两个样本之间的变量没有任何关联,不论两样本的容 量是否相同,所得数据皆为成组数据。两组数据以组 平均数作为相互比较的标准,来检验其差异的显著性。
如:随机抽测9头内江猪和9头荣昌猪经产母猪的产仔数: 内江猪:14,15,12,11,13,17,14,14,13 荣昌猪:12,14,13,13,12,14,10,10,20
分析:这里两品种猪的产仔数无任何关联,每种猪的产仔数分别组 成一组数据,相互比较时以组平均数做为比较标准,在Excel里进行t检验 时应采用“t检验-双样本等方差假设”或“t检验-双样本异方差假设”进 行分析。

配对试验—成对数据平均数的比较
试验单位两两配对,随机分配到两个处理,配 对的试验单位要求存在相似性,而每个处理内的各 试验单位不一定相似,可以变异较大,但配对内试 验单位要求相似,因此,两样本容量相同,所得数 据为成对数据,两组数据以相配对的试验单位之间 的差异作为相互比较的标准,来检验其差异的显著 性。
在Excel里进行t 检验时应采用“t检验-平均值的成 对二样本分析”模块进行分析。

配对试验—成对数据平均数的比较
如:从8窝仔猪中每窝选出性别相同、体重相近 的两头随机分配到两个饲料组中进行对比试验: 1 2 3 4 5 10.0 11.2 14.0 12.1 7.5 9.8 10.6 13.3 11.5 6.6 0.2 0.6 0.7 0.6 0.9 6 9.8 9.0 0.8 7 8 16.5 10.8 15.8 9.8 0.7 1.0

甲 x1 乙 x2 x 1- x 2

分析:每窝中选出的性别相同,体重相近的两头仔猪做为一个配对被 随机分到甲、乙两组饲喂两种饲料,但甲组中来自8窝的仔猪之间可以 性别不同,体重不相近,因此最后的数据是原来属于同一窝的两仔猪的 成对数据,比较的是配对仔猪之间的差异,而非两组平均数的差异。

非配对试验—成组数据平均数的比较 实例: 某研究所对三黄肉鸡进行饲养对比试 验,试验时间为60d,增重结果如下表,问 甲乙两种饲料对三黄鸡的增重效果有无显 著影响?

(1)假设 H0: μ1=μ2,即认为两种饲料增重效果相同。
HA: μ1≠ μ2,即认为两种饲料增重效果不同。 (2)水平 (3)检验 选取显著水平α=0.05

第一步,在Excel中输入数据

第二步,工具—数据分析—t检验-双样本等方差假设

第三步,得出检验结果

(4)推断

P=0.21>0.05,故接受H0,否定HA;

认为两种饲料饲喂三黄鸡的增重效果差异不显著。

配对试验—成对数据平均数的比较
实例1: 现从8窝仔猪中每窝选出性别相同、体重接近 的仔猪两头进行饲料对比试验,将每窝两头仔猪 随机分配到两个饲料组中,时间为30d,结果见下 表,问两种品牌饲料饲喂仔猪增重有无显著差异? 1 2 3 4 5 6 10.0 11.2 11.0 12.1 10.5 9.8 9.8 10.6 9.0 10.5 9.6 9.0 0.2 0.6 2.0 1.6 0.9 0.8 7 8 11.5 10.8 10.8 9.8 0.7 1.0

甲 x1 乙 x2 x 1- x 2

(1)假设 H0: μ1=μ2,即认为两种饲料增重效果相同。
HA: μ1≠ μ2,即认为两种饲料增重效果不同。 (2)水平 (3)检验 选取显著水平α=0.05

第一步,在Excel中输入数据

第二步,工具—数据分析—t检验-平均值的成对二样本分析

第三步,得出检验结果

(4)推断

P=0.0019<0.05,故否定H0,接受HA;

认为两种饲料饲喂仔猪的增重效果差异显著。

实例2: 现用国产与进口的背膘厚测定仪,对14头
肥猪进行了测定(单位:mm) ,数据如下:

进口 32 40 27 37 32 35 28 43 40 41 41 35 49 34 国产 43 44 30 34 30 31 26 26 42 40 42 43 37 43
试检验两种仪器测定的结果有无显著差异? 分析:这里是用国产和进口两种仪器测得同一头 猪的背膘厚数据分到两组,是同一样本前后两次 试验的结果,属配对试验设计。

(1)假设 H0: μ1=μ2,即认为两种仪器结果相同。
HA: μ1≠ μ2,即认为两种仪器结果不同。 (2)水平 (3)检验 选取显著水平α=0.05

第一步,在Excel中输入数据

第二步,工具—数据分析—t检验-平均值的成对二样本分析

第三步,得出检验结果

(4)推断

P=0.92>0.05,故接受H0,否定HA;

认为两种仪器测定背膘厚的结果差异不显著。

十、百分数资料的差异显著性检验
样本百分数与总体百分数差异显著性检验

两个样本百分数差异显著性检验

(一)样本百分数与总体百分数差异显著性检验

基本步骤:
1. 提出无效假设与备择假设 无效假设H0:p=p0 备择假设HA:p≠p0 2.计算t值

3.将计算所得的t的绝对值与1.96,2.58比较,作出统计推断
若 若 <1.96,则p>0.05,表明p与p0差异不显著; ≥2.58,则 p≤0.01,表明p与p0差异极显著; 若1.96≤ <2.58 ,则0.01<p≤0.05,表明p与p0差异显著;

实例:据往年调查,某地区的雏鸡白痢病的发病率一般为 30%,现对某鸡场500只雏鸡进行检测,结果有175只 凝集反应呈阳性,问该鸡场的白痢病是否比往年严重?

分析:此例总体百分数p0=30% 样本百分数p=175/500=35%
1. 提出无效假设与备择假设 无效假设H0:p=p0 备择假设HA:p≠p0 2.计算t值

=
于是

=0.0205
=(0.35-0.30)/0.0205=2.439

3.将计算所得的t的绝对值与1.96,2.58比较,作出统计推断
因为1.96≤2.44 <2.58 ,则0.01<p≤0.05,表明p=35%与p0=30%差 异显著,故该鸡场的雏鸡白痢病比往年严重。

(二)两个样本百分数差异显著性检验

基本步骤:
1. 提出无效假设与备择假设 无效假设H0:p1=p2 备择假设HA:p1≠p2 2.计算t值

3.将计算所得的t的绝对值与1.96,2.58比较,作出统计推断
若 若 <1.96,则p>0.05,表明p1与p2差异不显著; ≥2.58,则 p≤0.01,表明p1与p2差异极显著; 若1.96≤ <2.58 ,则0.01<p≤0.05,表明p1与p2差异显著;

实例:某猪场第一年饲养PIC品种商品仔猪10000头,死亡980头;第二年 饲养该品种仔猪10000头,死亡950头,试检验第一年与第二年仔猪死 亡率是否有显著差异?

分析:此例第一年死亡率p1=980/10000=9.8% 第一年死亡率p2=950/10000=9.5%
1. 提出无效假设与备择假设 无效假设H0:p1=p2 备择假设HA:p1≠p2 2.计算t值

= (980+950) /(10000+10000) =9.65%

= =0.00418

=(9.8%-9.5%)/0.00418=0.7177
3. 将计算所得的t 的绝对值与1.96,2.58比较,作出统计推断 因为0.7177 <1.96,则p>0.05,p1与p2差异不显著,表明第一年 仔猪死亡率与第二年仔猪死亡率差异不显著。


相关文章:
第二节 样本平均数与总体平均数差异显著性检验
第二节 样本平均数与总体平均数差异显著性检验在实际工作中我们往往需要检验一个样本平均数与已知的总体平均数是否 有显著差异,即检验该样本是否来自某一总体。已知...
常用显著性检验
数比较及双因素分组的多个样本均数的比较,方差分析首先是比 较各组间总的差异,如总差异显著性,再进行组间的两两比较,组间比 较用 q 检验或 LST 检验等...
常用显著性检验
常用显著性检验 1.t 检验 适用于计量资料、正态...均数的比较, 方差分析首先是比较各组间总的差异, ...Excel键盘快捷键 Photoshop的抠图技巧分析 20份文档 ...
浅谈考试成绩的显著性差异
EXCEL均数差异显著性检验... 71页 免费 标准差 7页 免费浅​谈​考​...浅谈考试成绩的差异显著性分析韶关市第十一中学 杨铁荣 内容提要:本文尝试运用...
几种常见的显著性检验方法
t 检验是用于比较两均数 间相差是否显著的。 t 检验过程:是对两样本均数(mean)差别的显著性进行检验。唯 t 检验须知 道两个总体的方差(Variances)是否相等; ...
显著性检验
(一)用 Excel 数据分析工具进行统计 2.t-检验 . 检验 检验方法, 在 Excel ...均数差异显著性检验 54页 免费 第七章___显著性检验的基... 35页 免费 ...
浅谈考试成绩的差异显著性分析
浅谈考试成绩的差异显著性分析 【摘要】本文尝试运用数理统计学中的显著性检验的基本思想 和常用的 excel 软件简单介绍了考试成绩中班级之间、校际之间的 平均分、...
统计学各种检验
均数比较及双因素分组的多个样本均数的比较, 方差分析首先是比较各组间总的 差异,如总差异显著性,再进行组间的两两比较,组间比较用 q 检验或 LST 检验等...
《生物统计学》复习题及答案
--- ---4 分 第三步:利用 Excel 自带公式或数据分析库计算概率值。---8...t 检验和 F 检验均平均数差异显著性检验的两种方法, 但前种方法仅是两...
Duncan法进行多组样本间差异显著性分析
适用范围 比较两组以上样本均数的差别, 这时不能使用 t 检验方法作两两间的...(excel 中用 STDEV 公式得出) 先做 0.05 水平下的显著性分析,用小写字母,...
更多相关标签:
平均数差异显著性检验 | 均值差异显著性检验 | spss差异显著性检验 | 显著性差异检验 | matlab显著性差异检验 | 数据差异显著性检验 | t检验 显著性差异 | 检验有无显著性差异 |