当前位置:首页 >> 数学 >>

专题5 数据统计分析


专题5 实验数据统计分析
通用数据统计分析软件平台:
SPSS 、 Stata 、 SAS 、 S-plus 、 R、
Eviews 、 Excel 、 Gauss 、 Matlab及其他……

一、 利用excell进行数据统计分析

例1 数据描述:均值、标准差、标准误差 某杂草种子在光照和黑暗条件下的萌发9天 后,每天的萌发种子数见下表。计算萌发率 的平均值、标准差和标准误差。

?

7月7日 7月8日 7月9日 7月10日 7月11日 7月12日 7月13日 7月14日 7月15日

光照 遮光 第一皿 第二皿 第三皿 第四皿 第一皿 第二皿 第三皿 第四皿 10 8 4 5 1 1 2 5 15 7 14 13 4 3 9 7 5 4 4 4 4 6 10 5 4 6 5 2 3 1 3 0 1 2 2 1 1 7 2 9 2 1 0 0 0 0 0 1 0 1 0 1 0 1 0 0 1 0 0 0 0 0 0 3 1 0 0 0 2 1 0 0

?

例2 有人配制两种不同饵料A、B养殖罗非 鱼,选取14个鱼池,随机均分两组进行试 验。经一定试验期后的产鱼量列入表(有一 鱼池遭遇意外而缺失数据)。试问这两种不 同饵料养殖罗非鱼的产鱼量有无差异?

组别 A料 B料

578 642

562 587

产鱼量 619 544 631 625

536 598

564 592

532

例3 10只家兔接种某种疫苗前后体温变化如表
,试检验接种前后体温是否有显著变化?

兔号 1 2 3 4 5 6 7 8 9 10 接种前体温 38 38.2 38.2 38.4 38.4 38.1 38.1 38.2 38.5 38.3 接种后体温 38.4 38.5 38.5 38.8 38.9 38.5 38.7 38.5 38.5 39

例4

5个不同品种猪的育肥试验,后期30d增种

(kg)如表。 试比较品种间增重有无显著差异。

品种 B1 B2 B3 B4 B5

21.5 16.0 19.0 21.0 15.5

19.5 18.5 17.5 18.5 18.0

增重 20.0 17.0 20.0 19.0 17.0

22.0 15.5 18.0 20.0 16.0

18.0 20.0 17.0

20.0 16.0

例5 测得12头长白仔猪出生重与断奶重
(kg)资料,试计算相关系数。
序号 1 2 3 4 5 6 7 8 9 10 11 12 初生重 断奶重 1.51 6.95 1.43 6.54 1.52 7 1.47 6.64 1.39 6.34 1.53 7.12 1.52 6.86 1.46 6.5 1.48 6.78 1.50 6.87 1.52 7.1 1.47 6.68

例6 试建立上例中长白仔猪断奶重
(y)与出生重(x)的直线回归方程。

二、 利用SPSS进行数据统计分析
?

SPSS(Statistical Product and Service Solutions),“统计产品与服 务解决方案”软件。最初软件全称为“ 社会科学统计软件包”(Statistical Package for the Social Sciences)。 SPSS是国内外应用非常广泛的统计软件 ,适用于市场调查、销售分析、企业管 理、社会调查、科学研究等多个领域。

三、利用R软件进行统计分析

(一)R的优点 ?开源;可编辑;

?功能全面(程序包各种各样),更新迅速;
?方便; ?数据储存和处理能力强大; ?尤其重要的是,免费,不涉及版权问题。

(二)R学习重要网站
1 R 官网 2 R Seek
http://www.r-project.org/

http://www.rseek.org/

3 R Graphical Manual
http://rgm2.lab.nig.ac.jp/RGM2/images.php?show=all&pageID=11

4 人大经济论坛

http://bbs.pinggu.org/index.php

(三)R软件和程序包的安装

基本包

程序包
搜索和帮助

(四)用R软件进行下列常用统计分析

1,数据描述:均值、标准差、标准误差
2,简单假设检验; 3,独立样本T检验; 4,成对样本T检验; 5,单因素方差分析;

6,双因素方差分析;
7,相关分析; 8,聚类分析;

1,数据描述:均值、标准差、标准误差
N0 H N1 N2 E1 E2 J 32 3.280824 26.59768 22.5849 0.831178 0.705778 0.946646 28 2.956283 19.22637 14.63589 0.686656 0.52271 0.887185 32 3.123495 22.72566 17.39098 0.710177 0.543468 0.90125 ?? ?? ?? ?? ?? ?? ??
R 程序: library(plotrix) a<-read.csv(file.choose()) mean<-mean(a,na.rm=TRUE) sd<-sd(a,na.rm=TRUE) se<-std.error(a,na.rm=TRUE) result<-cbind(mean, sd, se)

2 ,简单假设检验

X<-c(159, 280, 101, 212, 224, 379, 179, 264, 222, 362, 168, 250, 149, 260, 485, 170) test<-t.test(X, alternative = "greater", mu = 225)

来源:薛毅 & 陈立萍 (2006). 统计建模与R软件(上册).

3,独立样本T检验

来源:薛毅 & 陈立萍 (2006). 统计建模与R软件(上册).

3,独立样本T检验

R 程序: X<-c(78.1, 72.4, 76.2, 74.3, 77.4, 78.4, 76.0, 75.5, 76.7, 77.3) Y<-c(79.1, 81.0, 77.3, 79.1, 80.0, 79.1, 79.1, 77.3, 80.2, 82.1) test<- t.test(X - Y, var.equal=TRUE)

4,成对样本T检验; 例 某单位研究饮食中缺乏维生素E与肝中维生素A含量的关 系,将同种属的大白按性别相同,年龄、体重相近者配成对 子,共8对,并将每对中的两头动物随机分到正常饲料组和 维生素E缺乏组,过一定时期将大白鼠杀死,测得其肝中维 生素A的含量,问不同饲料的大白鼠肝中维生素A含量有无 差别?
大白鼠对号 1 2 3 4 5 6 7 8 正常饲料组 3550 2000 3000 3950 3800 3750 3450 3050 维生素E缺乏 2450 2400 1800 3200 3250 2700 2500 1750

张文彤 "SPSS 初级篇."

4,成对样本T检验;

a<-read.csv(file.choose(),head=T) x<-a[,2] y<-a[,3]

c<-t.test(x, y, lternative =
c("two.sided"),paired = TRUE)

5,单因素方差分析;

测定卷心菜播种日期对其产量的影响,试验采用了3个 不同时间进行播种,之后测量了卷心菜的重量,每个组 合10次重复。以其了解:播种日期对产量是否有影响? library(agricolae) library(car) a<-read.csv(file.choose(),head=T) #读入数据 factor<-as.factor(a$Date) #定义变量 with(a,leveneTest(HeadWt,Date)) # 方差整齐性检验 aov1<-aov(a$HeadWt~factor) # 方差分析 summary.aov(aov1)
数据来源MASS程序包

5,单因素方差分析;

# 多重比较 dferror<-df.residual(aov1) mserror<-deviance(aov1)/dferror cmp<-HSD.test(a$HeadWt,factor,dferror,mserror,group=T) cmp
#结果数据的提取 cmp$se<-signif(cmp$std.err, digits = 2) cmp$m<-paste(cmp$means,cmp$se,sep="±") c<-cmp[,c("trt","m","M")] #制表 cm<-cmp[,c(1:5)] cmpp<-cbind(c,cm) write.csv(cmpp,file="result.csv")

6,双因素方差分析;

测定卷心菜品种和播种日期对其产量的影响,试 验采用了2个品种,在3个不同时间进行播种,之 后测量了卷心菜的重量,每个组合10次重复。以 其了解:1)测定两个品种的产量是否有所差别 ,若有哪个更好;2)播种日期对产量是否有影 响;3)播种日期若有影响,是否具有品种依赖 性,也就说是否存在与品种之间的交互作用。

library(agricolae) library(car) a<-read.csv(file.choose(),head=T) #读入数据 a<-a[,2:5] factor<-as.factor(a$Cult) ##定义变量 factor2<-as.factor(a$Date) maov<-aov(a$HeadWt~factor*factor2) # 多因素 summary.aov(maov) a$comtreat<-as.factor(paste(factor,factor2,sep="")) aov2<-aov(HeadWt~comtreat,data=a) dferror<-df.residual(aov2) mserror<-deviance(aov2)/dferror cmp<HSD.test(a$HeadWt,a$comtreat,dferror,mserror,group= T) cmp

7,相关分析; 测定了一条被污染的河边一系列地点的土壤元素含 量和pH,以及土壤类型,问:

1)在该河边土壤pH主要与哪些因子相关?
2)沙土(sand)、粘土(clay)、软泥(slime)分别与那些 因子相关? 3)各因子间的关系?

7,相关分析;
library(agricolae) library(gplots) cor<-read.csv(file.choose()) a<-correlation(cor,method="pearson") b<-as.matrix(a$correlation) c<-as.matrix(a$pvalue) symp <- symnum(c, corr=FALSE, cutpoints = c(0,.01,.05, 1), symbols = c("**","*"," "))

# 或者 "spearman"

heatmap.2(a$correlation, col=bluered, symm=TRUE, margin=c(6, 6), trace="none",cellnote=symp )

write.csv(a,file="cor.csv")
数据来源“agricolae”程序包

8,聚类分析;



















问:如何大陆31各地区进行分组,以便为制定国民经济宏 观调控提供参考?

8,聚类分析;

library(cluster) a<- read.csv(file.choose(), row.name="district") d<-dist(a[,-1], method = "euclidean", # 此处方法还有很多 diag = FALSE, upper = FALSE, p = 2) di<-dist(d) hc<-hclust(di,"ward") # 此处方法还有很多 plot(hc,hang=-1)

推荐阅读: [1] Borcard, D., F. Gillet,P. Legendre. Numerical Ecology with R. 2011. [2] Gentleman, R., K.H. Giovanni,Parmigiani. Applied Spatial Data Analysis with R. 2008. [3] Gentleman, R., K. Hornik,G. Parmigiani. ggplot2 Elegant Graphics for Data Analysis. 2011. [4] Mittal, H.V. R Graphs Cookbook. 2011. [5] Muenchen, R.A.,J.M. Hilbe. R for Stata Users. 2010. [6] Sarkar, D. Lattice: 多元统计绘图和R. 2008. [7] 薛毅,陈立萍. 统计建模与R软件. 2006. [8] Murrell, P. R Graphics. 2006. [ 9] Paradis, E. R for Beginners. 2005.


相关文章:
005专题五 数据库建设报告
专题五 测土配方施肥数据库建立报告 建立测土配方施肥数据库的目的就是为了有效...试验数据分析和肥效评价数据:试验结果统计分析数据、肥效评价数据等 Ⅴ、跟踪...
专题五 典型试题分析
专题五 典型试题分析_政史地_高中教育_教育专区。专题五 典型试题分析 小学数学竞赛实际上就是解题能力的竞赛, 多做好题是提高解题能力的有效途径, 本讲 中精选...
专题训练5---概率统计(Word有详解答案)
专题训练5---概率统计(Word有详解答案) - 高 2015 级高三专题训练---概率统计 一、选择题 1.(文)某林场有树苗 30000 棵,其中松树苗 4000 棵,为调查...
专题5图解法动态分析
专题5图解法动态分析_理化生_高中教育_教育专区。图解法动态分析 专题5:图解法分析动态平衡问题方法:图解法分析动态平衡问题,往往涉及三个力,其中一个力为恒力,另...
专题五 概率与统计和统计案例 学生版
专题五 概率与统计统计案例 学生版 - 专题五 概率与统计统计案例 热点一 古典概型 1.古典概型的概率 m A中所含的基本事件数 P(A)== . n 基本事件...
专题5 统计与概率
___ 专题五常考点清单 统计与概率 一、重要概念 1...5.描述数据集中趋势和平均水平特征的数 (1)平均数...进行统计分析,将所有成绩由低到高 分成五组,并绘制...
【选修1-1,1-2,4-5】:专题五 统计案例 含解析
【选修1-1,1-2,4-5】:专题五 统计案例 含解析 - 一、题之源:课本基础知识 1.变量间的相关关系 (1)常见的两变量之间的关系有两类:一类是函数关系,另...
专题五:区位分析
北京英才苑网站 http://www.ycy.com.cn ·版权所有·盗版必究· 普通高中课程标准实验教科书—地理(人教版兼岳麓版) 专题五:区位分析【基础要点归纳】 基础要点...
中考数学专题复习五《数据的分析》同步练习含答案
中考数学专题复习数据分析》同步练习含答案 - 数据分析 一、选择题(每小题3分,共30分) 1.甲、乙两名学生进行射击练习,两人在相同条件下各射靶5次....
专题五 分析性文字的训练
专题五 分析性文字的训练_语文_高中教育_教育专区。分析性文字的训练例证法基本模式参考 ①观点句 ②阐释句 ③材料句 ④分析句 ⑤结论句(观点句) 【样本片断】...
更多相关标签: