当前位置:首页 >> 学科竞赛 >>

2012高教社杯全国大学生数学建模竞赛A题论文最新的


2012 高教社杯全国大学生数学建模竞赛







我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网 上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如

果引用别人的成果或其他公开的 资料(包括网上查到的资料) ,必须按照规定的参考文献的表述方式在正文引用处和参 考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规 则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展 示(包括进行网上公示,在书籍,期刊和其他媒体进行正式或非正式发表等。 ) 我们参赛选择的题号是(从 A/B/C/D 中选择一项填写) : A 我们的参赛报名号为(如果赛区设置报名号的话) : A1618 所属学校(请填写完整的全名) : 福州大学 参赛队员 (打印并签名) :1. 2. 3. 指导教师或指导教师组负责人 (打印并签名): 日期: 2012 年 9 月 10 日

赛区评阅编号(由赛区组委会评阅前进行编号):

2012 高教社杯全国大学生数学建模竞赛

编 号 专 用 页

赛区评阅编号(由赛区组委会评阅前进行编号):

赛区评阅记录(可供赛区评阅时使用): 评 阅 人

评 分

备 注

全国统一编号(由赛区组委会送交全国前编号):

全国评阅编号(由全国组委会评阅前进行编号):

葡萄酒的评价
摘要
本文要解决的是葡萄酒的评价问题,我们利用数理统计的知识,包括显著性差异检 验、主成分分析、聚类分析、典型相关分析、逐步线性回归分析等建立数学模型,分别 求解。 问题一,由题意知,要分析两组评酒员的评价结果有无显著性差异,需应用《概率 统计》中的假设检验知识以及 spss 软件中关于两个总体均值的假设检验。检验结果表 明,对于红葡萄酒,由于 Pr ? t 的值为 0.019 ? 0.05 ,故拒绝原假设 H .0 ,认为两个红葡 萄酒样本总体的均值不相等,同理,对白葡萄酒, Pr ? t 的值为 0.017 ? 0.05 ,认为两个 白葡萄酒样本总体的均值不相等。因此,两组评酒员的评价结果有显著性差异。而至于 哪一组结果更可信,我们先计算出第一组 10 位评酒员对每一个葡萄酒样品(红、白葡 萄酒样品数总共 55)品尝评分的标准差,再将得到的 55 个标准差数值求和作为第一组 的总标准差;同样我们将第二组 10 位评酒员对每一葡萄酒样品品尝评分的标准差,并 且也将得到的 55 个标准差数值求和作为第二组的总标准差。我们最后计算出第一组的 总标准差为 385.49,第二组的总标准差为 261.82,小于第一组的总标准差,所以第二 组结果更可信。 问题二,查阅相关资料可知,糖、酸、单宁、芳香物质和色素五大指标是葡萄的主 要构成物质,我们对附件 2 中的指标进行了简化和处理,统一选取了地位相同且具有代 表性的一级指标作为分析指标;对附件 3 中的芳香物质,使用 matlab 软件,进行主成 分分析,各浓缩成一个指标,其贡献率大于 85%,具有统计意义。然后,对以上得到的 所有指标类 1,加上问题一所求的一组更可信的平均值指标,我们对这些指标进行 Q 型 聚类分析,把酿酒葡萄分成了四个等级。 问题三,在分析酿酒葡萄与葡萄酒的理化指标对葡萄酒质量的影响时,我们运用了 spss 软件, 对红白葡萄和红白葡萄酒的理化指标类 1 分别进行 R 型聚类分析, 并挑选出 具有代表性的 8 组数据进行典型相关分析,计算出典型相关系数。使用 Bartlett 检验 统计量,对典型相关系数作显著性检验,最后选出具有密切联系的代表性因素。 问题四,我们将酿酒葡萄和葡萄酒的一级理化指标作为自变量,而葡萄酒质量作为 因变量, 使用逐步线性回归方法来分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影 响 。运用 SPSS 软件建立回归模型,根据多元回归模型: y ? a 0 ? ? a i xi 求得白葡
i ?1 n

? 萄酒质量的预报方程: y白

? 59.274? 0.477x30 ? 0.481x29 ? 0.842x20 ? 0.500x5 ? 9.405x10 ,

再对回归方程进行显著性检验,并得到显著性水平为 0.0001。 同理可求得红葡萄酒质

? 量的预报方程: y红 ? 64.562 ? 0.454x13 ? 0.447x6 ? 0.007x31 ? 10.186x32 ? 0.172x21 ,对回 归方程进行显著性检验,并得到显著性水平为 0.001。最后,我们进行了回代检验,得 到样本的平均相对误差分别为 1.99%和 2.55%,从而论证了能用葡萄和葡萄酒的理化指 标来评价葡萄酒的质量。
关键词:显著性差异检验 主成分分析 聚类分析 典型相关分析 逐步线性回
归分析

-1-

一、 问题重述
葡萄酒质量是其外观、香气、口感等的综合表现。确定葡萄酒质量时一般是通过聘 请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打 分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质 量有直接的关系, 葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄 的质量。 题中给出了某一年份一些葡萄酒的评价结果和该年份这些葡萄酒的和酿酒葡萄 的成分数据。本文要建立数学模型讨论下列问题: 1. 分析附件 1 中两组评酒员的评价结果有无显著性差异,哪一组结果更可信? 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄 酒的理化指标来评价葡萄酒的质量?

二、问题分析
附件中的数据处理说明: 1) 在附件 1 第一组红葡萄酒品尝评分中,品酒员 4 号对样品 20 的色调评分数据出 现了缺失,所以剔除这一列的数据。 2) 在附件 2 第一组白葡萄酒品尝评分中,品酒员 7 号对样品 3 号的持久性评分数 据出现了异常,所以剔除这一列的数据。 3) 对于附件 2 和 3 中的没有数据的单元格, 我们认为其值为 0, 所以将其全部赋值 为 0。 1. 第一题的问题分析 要分析两组评酒员的评价结果有无显著性差异,根据《概率统计》中两个总体均值 的假设检验知识,若 Pr ? t 的值小于 0.05,即拒绝原假设 H .0 ,认为两样本总体的均值 不相等,若 Pr ? t 的值大于 0.05,则接受原假设,认为两个样本总体的均值相等,由此 即可判断,两组评酒员的评价机构是否显著性差异。要判断哪一组的结果更加可信,我 们需要通过分析其总的标准差来断定结果。所以,我们必须先求出每一组中 55 个样品 所对应的标准差,然后将其标准差相加,得到我们最后要的总标准差。最后结果中总标 准差较小的,即是稳定性较好,更加具有可靠性。 2. 第二题的问题分析 水和糖是葡萄的最主要成分,是发酵成葡萄酒的物质基础;葡萄中酸的含量,对葡 萄酒的影响也很大;而单宁、色素和芳香物质在整个葡萄的物质构成中尽管所占比例非 常小,但它们对葡萄的特色和风味有着非常显著的贡献;可以说葡萄中的糖、酸、单宁、 芳香物质和色素是判断酿酒葡萄品质的指标性物质。因此,我们选取附件 2 中的一级理 化指标,加上芳香物质,两者一起作为相对应的葡萄的理化指标,接着运用主成分分析 和 Q 型聚类分析的方法将葡萄酒的样品分成四个等级。 3. 第三题问题分析 由于影响葡萄酒的主要理化指标包括:酒精度,总糖,浸出物,挥发性酸,单宁,
-2-

总酚,色度,色调,PH 值,并且这些成分主要蕴藏于葡萄的梗,皮,果肉,及籽中,因 此, 葡萄酒的理化指标中我们将用到的指标是附件 2 中葡萄酒的一级指标以及附件 3 中 经过整合的芳香物质指标。想要分析酿酒葡萄与葡萄酒的理化指标之间的关系,我们得 分别求红葡萄与红葡萄酒的理化指标之间的联系和白葡萄与白葡萄酒的理化指标之间 的联系;因此,我们得通过 R 型聚类分析处理,对红白葡萄和红白葡萄酒分别选取代表 性指标,通过对这些代表性指标的典型相关分析,反映酿酒葡萄和葡萄酒的理化指标之 间的联系,最后使用 Bartlett 检验统计量,对典型相关系数作显著性检验。 4. 第四题问题分析 要分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,我们将酿酒葡萄与葡萄 酒的理化指标合在一起作为新指标来分析此新指标对葡萄酒质量的影响。我们借助逐步 线性回归方法, 从方程中剔除无统计学作用的自变量, 从而简化了计算, 得到回归方程, 最后进行回代检验。

三、模型假设
1) 我们是通过聘请一批评酒员进行品评,每个评酒员在对葡萄酒进行品尝后对其分类 指标打分,然后求和得到其总分来确定葡萄酒的质量。 2) 假设每个评酒员品酒后对其分类指标打分是相互独立的, 评酒员之间并未相互讨论。 3) 假设给评酒员品评的葡萄酒是生产出来不久的,葡萄酒并未超过保质期,不影响评 酒员的品评。 4) 假设葡萄酒的质量不受酿酒技术以及其他外在因素的影响,只考虑本题中所给因素 的影响。 5) 假设影响葡萄和葡萄酒的性质主要是附件中提到的一级指标,二级指标的影响几乎 忽略不计。 6) 假设葡萄的芳香物质和葡萄酒的芳香物质分别作为一级指标,各包含在葡萄和葡萄 酒的理化指标中,论文中做出这种限定。

四、 符号说明
Pr :显著性检验中的概率值; t : t 检验中的 t 值; ? y :预报方程的因变量; x i :预报方程的第 i 个自变量;

a i :预报方程 x i 项的系数;

五、模型的建立与求解
问题一 附件 1 中两组评酒员评价结果的求解: 第一组中 10 位品酒员分别对每一份红葡萄酒样品品尝,评分的平均值作为这一红 葡萄酒样品的得分,第二组中 10 位品酒员分别对每一份红葡萄酒样品品尝,评分的平 均值作为这一红葡萄酒样品的得分,得到每个样品最后得分对照表(表 1)如下,其中
-3-

我们让样品按序号升序排列。 第一组 酒样品 红 1 62.7 第二组 酒样品 红 1 68.1 第一组 酒样品 红 10 74.2 第二组 酒样品 红 10 68.8 第一组 酒样品 红 19 78.6 第二组 酒样品 红 19 72.6 酒样品 酒样品 酒样品 酒样品 酒样品 8 5 6 7 9 73.3 72.2 71.5 72.3 81.5 酒样品 酒样品 酒样品 酒样品 酒样品 8 5 6 7 9 72.1 66.3 65.3 66 78.2 酒样品 酒样品 酒样品 酒样品 酒样品 14 15 16 17 18 73 58.7 74.9 79.3 59.9 酒样品 酒样品 酒样品 酒样品 酒样品 14 15 16 17 18 72.6 65.7 69.9 74.5 65.4 酒样品 酒样品 酒样品 酒样品 酒样品 23 24 25 26 27 85.6 78 69.2 73.8 73 酒样品 酒样品 酒样品 酒样品 酒样品 23 24 25 26 27 77.1 71.5 68.2 72 71.5 表1 同上, 两组品酒员对白葡萄酒 27 个样品评分, 得到每个样品最后得分对照表 (表 2) 如下,其中我们也让样品按序号升序排列。 酒样品 1 82 酒样品 1 77.9 酒样品 11 72.3 酒样品 11 71.4 酒样品 20 77.8 酒样品 20 76.6 酒样品 2 74.2 酒样品 2 75.8 酒样品 12 63.3 酒样品 12 72.4 酒样品 21 76.4 酒样品 21 79.2 酒样品 3 79.6667 酒样品 3 75.6 酒样品 13 65.9 酒样品 13 73.9 酒样品 22 71 酒样品 22 79.4 酒样品 4 79.4 酒样品 4 76.9 酒样品 14 72 酒样品 14 77.1 酒样品 23 75.9 酒样品 23 77.4 酒样品 5 71 酒样品 5 81.5 酒样品 15 72.4 酒样品 15 78.4 酒样品 24 73.3 酒样品 24 76.1 表2 酒样品 6 68.4 酒样品 6 75.5 酒样品 16 74 酒样品 16 67.3 酒样品 25 77.1 酒样品 25 79.5 酒样品 7 77.5 酒样品 7 74.2 酒样品 17 78.8 酒样品 17 80.3 酒样品 26 81.3 酒样品 26 74.3 酒样品 8 71.4 酒样品 8 72.3 酒样品 18 73.1 酒样品 18 76.7 酒样品 27 64.8 酒样品 27 77 酒样品 9 72.9 酒样品 9 80.4 酒样品 19 72.2 酒样品 19 76.4 酒样品 28 81.3 酒样品 28 79.6 酒样品 10 74.3 酒样品 10 79.8 酒样品 2 80.3 酒样品 2 74 酒样品 11 70.1 酒样品 11 61.6 酒样品 20 79.7778 酒样品 20 75.8 酒样品 3 80.4 酒样品 3 74.6 酒样品 12 53.9 酒样品 12 68.3 酒样品 21 77.1 酒样品 21 72.2 酒样品 4 68.6 酒样品 4 71.2 酒样品 13 74.6 酒样品 13 68.8 酒样品 22 77.2 酒样品 22 71.6

第一 组白 第二 组白 第一 组白 第二 组白 第一 组白 第二 组白

-4-

基于表 1 和表 2 中的相关数字可以得到:

图1 由图 1,可知 0.019 ? 0.05 和 0.017 ? 0.05 ,即拒绝原假设,接受备择假设,即两组 的均值不相等,所以两组品酒员的评价结果存在显著性差异。 通过 excel 中的数据处理, 我们计算出两组品酒员对红白葡萄酒评分的总标准差如 下表所示: 红 白 总标准差 第一组 157.39 228.10 385.49 第二组 114.46 147.36 261.82 表3 由表 3 可知,第二组的总标准差小于第一组的总标准差,即第二组品酒员对葡萄酒 样品的评分比较集中,而第一组的评分相对分散,所以,第二组品酒员的评价结果更可 信。 问题二 首先 ,依据附件 2 和附件 3 的数据运用主成分分析和 Q 型聚类分析的方法来对酿 酒葡萄的理化指标分别进行处理。用到的软件: Matlab 软件。 1. 红葡萄的理化指标处理: 1) 主成分分析:红葡萄的芳香物质经主成分分析后,得到 1 个主成分,贡献率为 91.05%(如图 a),具有统计学上的意义;即主成分指标基本可以代表所有测定指标 的成分指标,成为一个一级指标,同时也表明这些指标对红葡萄的(感官)质量有 着重要的影响。 2) 聚类分析:红葡萄的一级理化指标加上红葡萄的芳香物质,作为指标类 1。然后根 据对象的指标类 1,性质相近的个体归为一类,使得同一类中个体具有高度的同质
-5-

性,不同类之间的个体具有高度的异质性。结果如图下:

图2 由图 2 可知,我们将红葡萄样品分成了四类,如下: i. 5,24,17,20,26,4,27,25,13,19,10 ii. 6,18,15,7,12,22 iii. 11 iv. 1,8,14,2,23,9,3,16,21 2. 白葡萄的理化指标处理: 1) 主成分分析:白葡萄的芳香物质经主成分分析后,得到 1 个主成分,贡献率为 93.03% (如图 b) ,具有统计学上的意义;即主成分指标基本可以代表所有测定 指标的成分指标,成为一个一级指标,同时也表明这些指标对白葡萄的(感官) 质量有着重要的影响。 2) 聚类分析:对样品进行聚类分类,结果如图下:

图3
-6-

基于图 3,将白葡萄的样品分成了四类,分别为: i. 6,18,7,15,1,13 ii. 8,11,16,17,22 iii. 2,12,19,25,3,4,14,21,5,20,9,28,23,26,10,24, iv. 27

图a

图b

问题三 首先,对附件 3 中的数据进行处理,使空格处全部赋值为 0 ,接着对红白葡萄和红 白葡萄酒的理化指标进行 R 型聚类,最后运用典型相关分析分析酿酒葡萄和葡萄酒的理 化指标之间的联系。 1. 红葡萄与红葡萄酒理化指标之间的联系: 将红葡萄与红葡萄酒的理化指标分别进行 R 型聚类,通过 SPSS 软件得到如下结果: 1) 红葡萄的理化指标处理,如图 4,红线将红葡萄的理化指标进行 R 型聚类分成 8 个类,并挑选每个类中具有代表性的指标的数据来进行分析。

图4

基于图 4,将红葡萄的样品分成了 8 类,分别为: i. 29,32,30,14,28,
-7-

ii. iii. iv. v. vi. vii. viii.

3 16,18,22,17,1,20 19,21,31 5,7 11,13,10,4,12,2,33,26, 15,25,8,9,6 24,27,23

所以选取了 8 个代表性指标:28,3,20,21,5,26,6,24, 2) 红葡萄酒的理化指标处理,如图 5。通过 SPSS 软件将红葡萄酒的理化指标进行 R 型聚类并选取 8 个具有代表性的数据。

图5

基于图 5,将红葡萄酒的样品分成了 8 类,分别为: i. 8,11 ii. 10 iii. 3,6,2,4 iv. 1 v. 5 vi. 9 vii. 12 viii. 7 所以选取了 8 个代表性指标:7,12,9,5,1,10,6,8 2. 白葡萄与白葡萄酒的理化指标之间的联系: 将白葡萄与白葡萄酒的理化指标分别进行聚类,通过 SPSS 软件得到如下结果: 1) 白葡萄的理化指标处理, 如图下, 红线将白葡萄的理化指标进行 R 型聚类分成 8 个类,并挑选每个类中具有代表性的指标的数据来进行分析。
-8-

图6

基于图 6,对白葡萄分成 8 类 i. 28,30,10,20 ii. 16,18,17,22,1,6 iii. 2,9,15,31,12,13,11 iv. 24,27,23,26 v. 14, vi. 19,21,29,5,7 vii. 25,33,3 viii. 4,8,32 所以选取了 8 个代表性指标:20,2,26,14,19,7,25,32 2) 白葡萄酒的理化指标处理,如图 6。通过 SPSS 软件将白葡萄酒的理化指标进行 R 型聚类得到 8 个具有代表性的数据。

-9-

图7

基于图 7,对白葡萄酒分成 8 类: i. 8,10 ii. 9 iii. 4 iv. 11 v. 1,2,5 vi. 3, vii. 6 viii. 7 所以选取了 8 个代表性指标:8,9,4,11,2,3,6,7 根据典型相关系数选取几对典型变量如下: (一) 白葡萄和白葡萄理化指标之间的相关系数 i. 然后使用 Bartlett 检验统计量,对典型相关系数作显著性检验,得到的结果:

第一典型相关系数为 0.879,第二典型相关系数为 0.861,它们均比酿酒葡萄的理化指 标与葡萄酒的理化指标两组间的任何一个相关系数大(其中最大相关系数为 0.7574) , 即综合的典型相关效果要好于简单相关分析。 ii. 典型相关系数及显著性检验

- 10 -

上面的输出结果表明:在 ? ? 0.05 的情况下,第一典型相关系数是显著的。 iii. 典型变量的系数——酿酒葡萄的理化指标

来自酿酒葡萄的理化指标的第一典型变量的计算公式: u1 ? ?0.009x1 ? 0.096x2 ? 0.86x3 ? 0.096x4 ? 0.156x5 ? 0.126x6 ? 0.435x7 ? 0.335x8 iv. 典型变量系数——葡萄酒的理化指标

来自葡萄酒的理化指标的第一典型变量的计算公式: v1 ? 0.884x9 ? 0.129x10 ? 0.251x11 ? 0.09x12 ? 0.066x13 ? 0.11x14 ? 0.362x15 ? 0.441x16 对上述分析如下:在这一对典型变量中,在酿酒葡萄的理化指标中 x3 (出汁率)和

x7 (果梗比)的系数比较大,在葡萄酒理化指标中 x9 (DPPH 半抑制体积)和 x16 (酒 总黄酮)的系数较大,所以第一对典型变量可以解释为:酿酒葡萄的出汁率和果梗 比与 DPPH 半抑制体积和酒总黄酮之间的联系。
(二) v. 红葡萄和红葡萄理化指标之间的相关系数 然后使用 Bartlett 检验统计量,对典型相关系数作显著性检验,得到的结果:

- 11 -

第一典型相关系数为 0.915,第二典型相关系数为 0.893,第三典型相关系数为 0.731, 它们均比酿酒葡萄的理化指标与葡萄酒的理化指标两组间的任何一个相关系数大(其中 最大相关系数为 0.6926) ,即综合的典型相关效果要好于简单相关分析。 vi. 典型相关系数及显著性检验

上面的输出结果表明:在 ? ? 0.05 的情况下,第一典型相关系数是显著的。 vii. 典型变量的系数——酿酒葡萄的理化指标

来自酿酒葡萄的理化指标的第一典型变量的计算公式: z1 ? ?0.073x1 ? 0.127x2 ? 0.156x3 ? 0.135x4 ? 0.012x5 ? 0.033x6 ? 0.878x7 ? 0.023x8 viii. 典型变量系数——葡萄酒的理化指标

- 12 -

来自葡萄酒的理化指标的第一典型变量的计算公式: w1 ? 0.046x9 ? 0.375x10 ? 0.098x11 ? 1.225x12 ? 0.083x13 ? 0.75x14 ? 0.45x15 ? 0.671x16 对上述分析如下:在这一对典型变量中,在酿酒葡萄的理化指标中 x7 (苹果酸)的 系数比较大,在葡萄酒理化指标中 x12 (花色苷)和 x14 (色泽)的系数较大,所以 第一对典型变量可以解释为:酿酒葡萄的苹果酸和葡萄酒的花色苷和色泽的联系。

问题四 为了研究酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,我们先将红葡萄的一 级理化指标和红葡萄酒的一级指标组合成一个具有 44 个理化指标的数据,作为自变量; 而第二组品酒员对红葡萄酒评价的平均评分作为因变量和上述数据合并成一个数据。然 后在 spss 中打开,使用 spss 中的逐步线性回归分析,得到结果如图所示 1. 研究红葡萄和红葡萄酒的理化指标对红葡萄酒质量的影响,结果如下表 4、表 5 所示:

表 4(方差分析表) 表 4 是逐步回归每一步的回归模型的方差分析表,F 值为 19.652,显著性概率是 0.0001,表明回归极为显著。
- 13 -

表5 表 5 是逐步回归每一步的回归方程系数表。 分析:建立回归模型 根据多元回归模型: y ? a 0 ? ? a i xi
i ?1 n

从表 5 中看出,过程一共运行了五步,最后一步就是表中的第 5 步的计算结果,可 知 33 个变量中只进入了 5 个变量 x13 , x6 , x31 , x32 , x21 把表 5 中“非标准化回归系数”栏目中的“B”列数据代人多元回归模型得到预报

? 方程: y红 ? 64.562 ? 0.454x13 ? 0.447x6 ? 0.007x31 ? 10.186x32 ? 0.172x21
? 预测值 y红 的标准差可用剩余标准差估计: S y红 ? 3.450 ? ?1.857 ?
回归方程的显著性检验: 从表 4 中方差分析表第 5 模型中得知 F 统计量为 19.652, 系统自动检验的显著性水 平为 0.000(非常小) 。 F(0.0001,5,21)值为 9.11。因此回归方程相关性非常显著。 2.同样可研究白葡萄和白葡萄酒的理化指标对白葡萄酒质量的影响, 结果如下表 6、 表 7 所示:

- 14 -

表 6(方差分析表) 表 6 是逐步回归每一步的回归模型的方差分析表,F 值为 6.936,显著性概率是 0.001,表明回归也极为显著。

表7 表 7 是逐步回归每一步的回归方程系数表。
- 15 -

分析:建立回归模型 根据多元回归模型: y ? a 0 ? ? a i xi
i ?1 n

从表 7 中看出,过程一共运行了五步,最后一步就是表中的第 7 步的计算结果,可 知 33 个变量中只进入了 5 个变量 x30 , x29 , x20 , x5 , x10 . 把表 7 中“非标准化回归系数”栏目中的“B”列数据代人多元回归模型得到预报

? 方程: y白

? 59.274? 0.477x30 ? 0.481x29 ? 0.842x20 ? 0.500x5 ? 9.405x10

? 预测值 y白 的标准差可用剩余标准差估计: S y白 ? 4.790 ? ?2.189 ?
回归方程的显著性检验: 从表 6 中方差分析表第 5 模型中得知 F 统计量为 6.936,系统自动检验的显著性水 平为 0.001(非常小) 。 F(0.001,5,22)值为 6.19。因此回归方程相关性也非常显著。 综上分析可知,两种情况下得到的回归方程相关性都很显著。最后,我们进行了回 代检验,得到样本的平均相对误差分别为 1.99%和 2.55%,从而很好的论证了能用葡萄 和葡萄酒的理化指标来评价葡萄酒的质量。

五、 模型的检验
对问题 2 中酿酒葡萄建立的等级与葡萄酒的质量区分等级进行一一对应检查,发现 葡萄质量的分类与葡萄酒的质量具有内在的关系。属于同一级别的酿酒葡萄酿出的酒很 大程度上是属于同一级别的。 对问题 3 得到的典型相关向量,我们进行 Bartlett 检验。首先,我们通过 R 型聚 类分析处理,对红白葡萄和红白葡萄酒分别选取代表性指标;然后,通过对这些代表性 指标的典型相关分析,反映酿酒葡萄和葡萄酒的理化指标之间的联系 ;最后使用 Bartlett 检验统计量,对典型相关系数作显著性检验。 关于问题 4 建立的模型,我们借助逐步线性回归方法,从方程中剔除无统计学作用 的自变量,从而简化了计算,得到回归方程;最后进行回代检验,得到红白葡萄酒的质 量平均相对误差各为 2.55%和 1.99%。

六、 模型优缺点分析及讨论
优点:该模型对求解葡萄酒以及其他酒的评价模型具有通用性,在分析葡萄和葡萄 酒的理化指标以及葡萄酒的质量之间的关系时,能够充分利用理化指标进行客观分析, 既定性又定量的概括了影响这些关系的主要指标因素,同时能充分利用指标因素并解释 他们之间的内在规律联系。 缺点:模型的假设条件不能完全满足,从而使得模型具有一定的局限性;由于检验 的统计量很多,只能选择其一,无法进行统计量优良的比较;对于第四题当中建立的逐 步回归分析模型,由于使用了所有的样品数,只能进行回代检验,无法进行外延预测, 存在一定的局限性;在主成分分析中,由于舍弃了一些贡献率小的变量因素,迫使模型 的准确性下降。

- 16 -

七、 结论
经过对葡萄酒的评价问题的一系列分析,我们知道不同的品酒员对相同葡萄酒样品 的评价结果存在着一定的差异,评价结果的可信度也不一定相同,我们要加以判断。在 根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级时,我们发现酿酒葡萄的 理化指标主要由,糖、酸、单宁、芳香物质和色素五大指标决定的,同时,酿酒葡萄的 理化指标和葡萄酒的质量存在着密切的对应关系。 白葡萄:酿酒葡萄的出汁率和果梗比与 DPPH 半抑制体积和酒总黄酮之间的联系。 红葡萄:酿酒葡萄的苹果酸和葡萄酒的花色苷和色泽的联系 同时,酿酒葡萄和葡萄酒的理化指标对葡萄酒质量具有重要影响,两者一定程度上 呈多元线性回归关系。

参考文献
参考文献: [1]茆诗松,程依明,濮晓龙,概率统计与数理统计教程(第二版),出版地:高等 教育出版社,2011 [2]东方人华, 周皓,统计基础和 SPSS11.0(第一版)出版地: , 清华大学出版社,2005 [3]汪晓银, 邹庭荣,数学软件与数学实验 (第一版) 出版地: , 科学教育出版社,2008 [4]汪晓银,周保平,数学建模与数学实验 (第一版) ,出版地:科学出版社 [5]王宏建,全国大学生数学建模竞赛优秀论文汇编(第一版) ,2012 [6]李运,李记明,姜忠君,统计分析在葡萄酒质量评价中的应用, http://d.wanfangdata.com.cn/Periodical_niangjkj200904020.aspx 2012-9-7

[7]于贞,姜爱莉,主成分分析法研究酚类物质对葡萄酒品质的影响, http://d.g.wanfangdata.com.cn/Periodical_niangjkj201106028.aspx 2012-9-7

[8]焦裕朋,多元统计分析课程设计—能源消耗与经济增长之间的典型相关分析, http://wenku.baidu.com/view/7296bed1195f312b3169a594.html [9]中华统计学习网,逐步回归分析, http://wenku.baidu.com/view/86a31bed4afe04a1b071def4.html [10]百度知道,葡萄的营养成分,
- 17 -

2012-9-8

2012-9-9

http://zhidao.baidu.com/question/436324473.html&__bd_tkn__=73b9492e7b38da255b0 78d79eeb822ac961cdff58078338d51fed8133ea5c69d362ad36bb4bcda3b39bb3949f6bbe4708 7ac3af56e60b1f4e7eb60157c5ffb319f63adff5d0f03de0125277ea33aca784a7fe8707d58bf8fd0 3a477d7c293a58cd627f424cb7dade9b09feaccbdc8d0cc9372af148aa 2012-9-9

附录
典型相关分析的 spss 宏程序: INCLUDE file 'C:\Program Files\SPSSEVAL\canonical correlation.sps'/. CANCORR SET1=X1 X2 X3 X4 X5 X6 X7 X8/ SET2=X9 X10 X11 X12 X13 X14 X15 X16. Q 型聚类分析的 matlab 程序: newX=zscore(X) D=pdist(newX) squareform(D) Z=linkage(D,'ward') dendrogram(Z) %标准化数据 %计算距离矩阵 %以矩阵形式显示 %按类平均法进行系统聚类 %画谱系图

T=cluster(Z,4); 主成分分析的 matlab 程序: Cwstd.m——用总和标准化法标准化矩阵 Cwfac.m——计算相关系数矩阵;计算特征值和特征向量;对主成分进行排序;计 算各特征值贡献率;挑选主成分(累计贡献率大于 85%) ,输出主成分个数;计算主成分 载荷 Cwscore.m——计算各主成分得分、综合得分并排序 Cwprint.m——读入数据文件;调用以上三个函数并输出结果

- 18 -

3.源程序

3.1 cwstd.m
%cwstd.m,用总和标准化法标准化矩阵 function std=cwstd(vector) cwsum=sum(vector,1); [a,b]=size(vector); for i=1:a for j=1:b std(i,j)= vector(i,j)/cwsum(j); end end %对列求和 %矩阵大小,a 为行数,b 为列数

3.2 cwfac.m
%cwfac.m function result=cwfac(vector); fprintf('相关系数矩阵:\n') std=CORRCOEF(vector) %计算相关系数矩阵

fprintf('特征向量(vec)及特征值(val):\n') [vec,val]=eig(std) newval=diag(val) ; [y,i]=sort(newval) ; fprintf('特征根排序:\n') for z=1:length(y) newy(z)=y(length(y)+1-z);
- 19 -

%求特征值(val)及特征向量(vec)

%对特征根进行排序,y 为排序结果,i 为索引

end fprintf('%g\n',newy) rate=y/sum(y); fprintf('\n 贡献率:\n') newrate=newy/sum(newy) sumrate=0; newi=[]; for k=length(y):-1:1 sumrate=sumrate+rate(k); newi(length(y)+1-k)=i(k); if sumrate>0.85 break; end end %记下累积贡献率大 85%的特征值的序号放入 newi 中

fprintf('主成分数:%g\n\n',length(newi)); fprintf('主成分载荷:\n') for p=1:length(newi) for q=1:length(y) result(q,p)=sqrt(newval(newi(p)))*vec(q,newi(p)); end end disp(result) %计算载荷

3.3 cwscore.m
%cwscore.m,计算得分
- 20 -

function score=cwscore(vector1,vector2); sco=vector1*vector2; csum=sum(sco,2); [newcsum,i]=sort(-1*csum); [newi,j]=sort(i); fprintf('计算得分:\n') score=[sco,csum,j] %得分矩阵:sco 为各主成分得分;csum 为综合得分;j 为排序结果

3.4 cwprint.m
%cwprint.m function print=cwprint(filename,a,b); %filename 为文本文件文件名, 为矩阵行数(样本数), 为矩阵列数(变量指标数) a b fid=fopen(filename,'r') vector=fscanf(fid,'%g',[a b]); fprintf('标准化结果如下:\n') v1=cwstd(vector) result=cwfac(v1); cwscore(v1,result);

- 21 -


相关文章:
2012高教社杯全国大学生数学建模竞赛A题论文最新的
2012高教社杯全国大学生数学建模竞赛A题论文最新的_理学_高等教育_教育专区。2012年全国数学建模大赛A题优秀论文 2012 高教社杯全国大学生数学建模竞赛 承 诺 书...
2012年高教社杯全国大学生数学建模竞赛A题全国一等奖论文
2012高教社杯全国大学生数学建模竞赛A题全国一等奖论文_理学_高等教育_教育专区。2012高教社杯全国大学生数学建模竞赛A题全国一等奖论文葡萄...
2012高教社杯全国大学生数学建模竞赛B题获奖论文
2012高教社杯全国大学生数学建模竞赛B题获奖论文_其它_高等教育_教育专区。写的很好,注意格式今日推荐 50份文档 2014年注册会计师考试 ...
2012高教社杯全国大学生数学建模竞赛A题论文
2012高教社杯全国大学生数学建模竞赛A题论文_理学_高等教育_教育专区。2012 高教社杯全国大学生数学建模竞赛 承 诺 书 我们仔细阅读了中国大学生数学建模竞赛的竞...
2012高教社杯全国大学生数学建模竞赛B题获奖论文
2012高教社杯全国大学生数学建模竞赛B题获奖论文_理学_高等教育_教育专区。我们奋斗了三天三夜的结果。荣获山东省二等奖!!2012 高教社杯全国大学生数学建模竞赛 ...
2012高教社杯全国大学生数学建模竞赛A题论文
2012高教社杯全国大学生... 23页 免费 2012年数学建模A题一等奖... 20页 ...? ai ? ? ? a j 4 2 i ?1 4 7 j ?1 由于品酒师给葡萄酒的满分为...
2012高教社杯全国大学生数学建模竞赛题目
2012 高教社杯全国大学生数学建模竞赛题目(请先阅读“全国大学生数学建模竞赛论文格式规范” ) A题 葡萄酒的评价 确定葡萄酒质量时一般是通过聘请一批有资质的评...
2012年全国数学建模竞赛A题全国优秀论文
2012年全国数学建模竞赛A题全国优秀论文_数学_自然科学_专业资料。2012 高教社杯全国大学生数学建模竞赛 承 诺 书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则...
2012年高教社杯全国大学生数学建模竞赛D题国家二等奖论文
2012 高教社杯全国大学生数学建模竞赛 承 诺 书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、...
更多相关标签:
大学生数学建模竞赛 | 全国大学生建模竞赛 | 2016大学生建模竞赛 | 大学生数学建模竞赛吧 | 美国大学生建模竞赛 | 大学生建模竞赛官网 | 大学生建模竞赛 | 国大学生数学建模竞赛 |