实例介绍
2012年全国大学生数学建模竞赛A题一等奖论文。
高教社杯全国大学生数学建模竞赛 编号专用页 赛区评侧编号(由赛区组委会评阅前进行编号): 赛区评阅记录(可供赛区评阅时使用): 全国统编号(由赛区组委会送交全国前编号): 全国评阅编号(由全国组委会评阅前进行编号): 基于数理分析的葡萄及葡萄酒评价体系 摘要 葡萄酒的质量评价是硏究葪萄酒的一个重要领域,目前葡萄酒的质量主要由 评酒师感官评定。但感官评定存在人为因素,业界一自在尝试用葡萄的理化指标 或者葡萄洏的理化指标定量评价葡萄洒的质量。本题要求我们根据葡萄以及葡萄 酒的相关数据建模,并研究基」理化指标的葡萄酒评价体系的建立 对于问题一,我们首先用配对样品t检验方法研究两组评酒员评价差异的显 著性,将红葡萄酒与白葡萄酒进行分类处理,用SPSS软件对两组ⅳ酒员的评分 的各个指标以及总评分进行了配对样本t检验。得到的部分结果显示:红葡萄酒 外观色调、香气质量的评价存在显著性差异,其他单指标的评价不存在显著差异 白葡萄、红葡萄以及整休的评价存在显著性差异 接着我们建立了数掂可信度评价模型比较两组数据的可信性,将数据的可信 度评价转化成对两组评酒员评分的稳定性评价。首先我们对单个评酒员评分与该 组所有评酒员评分的均值的偏差进行了分析,偏差不稳定的点就成为噪声点,表 明此次评分不稳定。然后我们用两组评酒员评分的偏差的方差衡量评酒员的稳定 性。得到第2组的方差明显小于第1组的 从而得出了第2组评价数据 的可信度更高的结论。 对于问题二,我们根据酿酒葡萄的理化指标和葡萄酒质量对葡萄进行了分 级。方面,我们对酿酒葡萄的级理化指标的数据进行标准化,基于主成分分 析法对其进行了因子分析,并且得到了27种葡萄理化指标的综合得分及其排序 (见正文表5)。另一方面,我们又对附录给出的各单指标百分制评分的权重进 行评价,并用信息熵法重新确定了权重,用新的权重计算出27种葡萄酒质量的 综合得分并排序(见正文表6)。最后我们对两个排名次序用基于模糊数学评价 方法将葡萄的等级划分为1-5级(见正文表8)。 对于问一,首先我们将众多的葡萄理化指标用主成分分析法综合成6 个主因子,并将葡萄等级也列为主因子之一。对葡萄的6个主因子,以及葡萄酒 的10个指标用SPSS软件进行偏相关分析,得到酒黃酮与葡萄的等级正相关性较 强等结论。之后对相关性较强的主因子和指标作多元线性回归。得到了葡萄酒 10个单指标与主因了之间的多元回归方程,该回归方程定量表示两者之间的联 系 对于问题四,我们首先将葡萄酒的理化指标标准化处理,对葡萄酒的质量与 荀萄的6个主因子和葡萄酒的10个单指标作偏相关分析,并求出多元线性回归 方程。该方程就表示了葡萄和葡萄酒理化指标对葡萄酒质量的影响。之后,我们 通过通径分析方法中的逐步回归分析得到葡萄与葡萄酒的理化指标只确定了葡 萄酒质量信息的47%。从而得出了不能用葡萄和葡萄酒的理化指标评价葡萄酒的 质量的结论。接着我们还采用通径分析屮的间接通径系数分析求出各自变量之间 通过传递作用对应变量的影响,得到单宁与总酚传递性影响较强等结论 最后,我们对模型的改进方向以及优缺点进行了讨论。 关键词:配对样本t检验数据可信度评价主成分分析模糊数学评价 综合评分信息熵偏相关分析多元线性回归 1问题重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒 员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡 萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒 荀萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件中给岀∫某 年份一些葡萄酒的评价结果,并分別给出了该年份这些葡萄酒的和酿酒葡萄的 成分数据。我们需要建立数学模型并且讨论下列问题: 1.分析附件1中两组评洒员的评价结果有无显著性差异,并确定哪一组的 评价结果更可信。 2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用 荀萄和葡萄酒的理化指标来评价葡萄酒的质量 2模型的假设与符号的约定 2.1模型的假设与说明 (1)评酒员的打分是按照加分制(不采用扣分制); (2)假设20名评酒员的评价八度在同一区间(数据合理,不需要标准化) (3)每位评酒员的系统误差较小,在本问题屮可以忽略不计 (4)假设附件中给出的葡萄和荀萄酒理化指标都准确可靠。 2.2符号的约定与说明 符号 符号的意义 原假设 显著性概率 第1组评酒员对第号品种葡萄酒评分的平均值, 第2组评洒员对第号品种葡萄酒评分的平均值 第一组评酒员对指标评分的偏差的方差, 第二组评酒员对指标评分的偏差的方差,=…, 第1组10位评酒员对号酒样品第项指标评分的平均分 第组第号评酒员对号酒样品第项指标评分与平均值的偏 第1组第号评酒员对其项指标评分与平均值的偏差的平均 第2组第个评酒员的总体指标偏差的方差 重新确立的第项指标的权重 第2组10个评酒员的总体指标偏差的方差 评酒员指标的平均评分,= 葡萄的第项指标, 葡萄的第项因子,= 葡萄酒的第项理化指标 3问题一的分析与求解 3.1问题一的分析 题冂要求我们根据两组评酒员对27种红葡萄洒和28种白葡萄泙的10个指 标相应的打分情况进行分析,并确定两组评酒员对葡萄酒的评价结果是否有显著 性差异,然后判断哪组评酒员的评价结果更可信 初步分析可知:由于评酒员对颜色、气味等感官指标的衡量人度不同,因此 两组评酒员评价结果是否具有显著性差异应该与评价指标的类型有关,不同的评 价指标的显著性差异可能会不同。同时,由于红葡萄酒和白葡萄酒的外观、口味 竽指标羔异性较大,处理时需要将白葡萄酒和红葡萄酒的评价结果的显著性差昦 分开讨论。 基于以上分析,我们可以分别两组品尝同一种类酒样品的评酒员的评价结果 进行两两配对,分析配对的数据是否满烂配对样品t检验的前提条件,而且根据 常识可知评酒员对同一种酒的同一指标的评价在实际中是符合t检验的条件的。 接着我们就可以对数据进行多组配对样品的t检验,从而对两组评洒员评价 结果的显著性差异进行检验。 由于对同一酒样品的评价数据只有两组,我们只能通过评价结果的稳定性来 判定结果的可靠性。而每组结果的可靠性乂最终决定于每个评酒员的稳定性,因 此将问题转化为对评酒员稳定性的评价。 3.2配对样品的t检验简介 统计知识指出:配对样本是指对冋一样本进行两次测试所获得的两组数据, 或对两个完全相同的样本在不同条件下进行测试所得的两组数据。在本问中我们 可以把配对样品理解为有27组两个完全相同的酒样品在两组不同评酒员的检测 下得到的两组数据,两组屮各个指标的数据为每组评酒员对该指标打分的平均 值 配对样品的t检验可检测配对双方的结果是否具有显著性差异,因此就可以 检验出配对的双方(第一组与第二组)对葡萄酒的评价结果是否冇差异性 型对样品t检验具有的前提条件为: (1)两样品必须配对 (2)两样品来源的总体应该满足正态性分布。 配对样品t检验基本原理是:求出每对的差值如果两种处理实际上没有差 异,则差值的总体均数应当为0,从该总体中抽出的样本其均数也应当在0附近 波动;反之,如果两种处理有差异,差值的总体均数就应当远离0,其样本均数 也应当远离0。这样,通过检验该差值总体均数是否为0,就可以得知两种处理 有无差异。该检验相应的假设为: =,两种处理没有差別,4≠两和处理存在差别 3.3葡萄酒配对样品的t检验 问题一中配对样品为27组两个完全相同的酒样品在两组不同评酒员的检测 下得到的两组数据,其中两组中各个指标的数据为各组10个评酒员对该指标打 分的平均值。该问题中的10个指标分别为:外观澄清度、外观色调、香气纯正 度、香气浓度、香气质量、口感纯正度、口感浓度、口感持久性、口感质量、平 衡/总休评价。 根据t检验的原理,对荀萄酒配对样品进行t检验之前我们要对样品进行正 态性检验。首先我们根据附件一并处理表格中的数据,得到配对样品的两组数据, 绘制红葡萄酒配对样品表格部分数据如表1 表1红葡萄酒配对样品数据表 澄清度 澄清度 平衡/整 平衡/整 (1组均值)(2组均值) 体评价(1组体评价(2组 均值) 均值) 2. 3.1 8.4 红2 9.6 红26 3.6 3.7 8.8 红27 3.7 3.7 8.8 白葡萄酒配对样品表格部分数据如表2: 表2白葡萄酒配对样品数据表 澄清度 澄清度 平衡/整 平衡/整 (1组均值)(2组均值) 体评价(1组体评价(2组 均值) 均值) 白1 7.7 8.4 白2 2.9 3.1 9.1 日26 白27 3.7 7 8.8 从上表中我们能看出,将白葡萄酒和红葡萄酒中的每个指标分别进行样 品的配对后,每一个指标的配对结果有27对,每一对的双方分别是1组和2组 的评酒员对该指标的评分的平均值。 3.3.1样本总体的K-S正态性检验 配对样品的t检验要求两对应样品的总体满足正态分布,则总体中的样品应 该满足正态性或者近似正态性,样本的正态性检验如卜 以红葡萄酒的澄清度的27组数据为例分析:利用SPSS软作绘制两样品的直 方图和趋势图如图1所示: 图1红葡萄酒澄清度两组数据自方图 我们假设两组总体数据都服从态分布,利用SPSS软件进行KS忙态性检 验的具体结果见附录2.3。两组数据的近似相伴概率值P分别为0.239和0.329, 大于我们一般的显著水平0.05则接受原来假设,即两组红葡萄酒的澄清度数据 符合近似正态分布 同理可用SPSS软件对其他指标的正态性进行检验,得到结果符合实际猜想, 都服从近似正态分布。 3.3.2葡萄酒配对样品t检验步骤 两种葡萄酒的处理过程类似,这里我们以对红葡萄酒谜价结果的差异的显著 性分析为例。 step1:我们以第一组对葡萄酒的评价结果总体服从正态分布 〃σ,以第二组对葡萄酒的评价结果总体服从正态分布μσ。我们 已分别从两总体中获得了抽样样本 和 ,并分别进行 两样品相互配对。(具体数据见附录2.1) Step2:;引进一个新的随机变量 ,对应的样本为 将配对样本的t检验转化为单样本t检验 Step3:建立零假设4=,构造t统计量; Step4:利用SPSS进行配对样品t检验分析,并对结果做出推断 3.4显著性差异结果分析 3.3.1红葡萄酒各指标差异显著性分析 由SPSS软件对红葡萄酒各指标的配对样品讠枍验后,得到各指标的显著性 概率分布表。(结果如表3所示) 表3红葡萄酒酒各指标显著性概率P 指标外观澄清度外观色调香气纯正度香气浓度‖香气质量 P 0.614 0.002 0.1510.100 0.010 指标口感纯正度口感浓度口感持久性口感质量平衡/整体 P 0.437 0.158 0.2510.055 0.674 由统计学知识,如果显著性概率P<显著水平α,(α=),则拒绝零假设, 即认为两总体样本的均值存在显著差异。若P>显著水平α,则不能拒绝零 假设,即认为两总体样本的均值不存在显著差异。 则根据表3可得:两组评酒员对红葡萄酒各项指标的评价中除外观色调、香 气质量存在显著性差异以外,其他8项指标都无显著性差异。 3.3.2白葡萄酒各指标差异显著性分析 代入白葡萄酒的评价数据,重复以上步骤,得到白荀萄酒各指标的显著性概 率分布表。(结果如表4所示) 表4白葡萄酒各指标显著性概率P分布表 指标外观澄清度外观色调香气纯正度香气浓度香气质量 P 0,299 0.089 0.93 0.238 0.714 指标口感纯正度口感浓度口感持久性口感质量平衡/整体 0,000 0.005 0.863 0.000 0.00l 分析表4可得:两组评酒员对白葡萄酒各项指标的评价中只有凵感纯正度」 感浓度、凵感质量、平衡/整体评价存在显著性差异,其他6项指标都无显著 性差异 3.3.3葡萄酒总体差异显著性分析 (1)红葡萄酒总体差异显著性分析 该问题的附件中已经给出了10项指标的杈重,因此将10项指标利用加权 合并成总体评价。对于红葡萄酒两组评价结果构造两组配对t检验。得到显著性 概率P=0.030< 即红荀萄酒整体评价结果有显著性差异。 (2)白葡萄酒总体差异显著性分析 同理对于白葡萄酒两红评价结果枃造两组巸对t检验。得到显著性概 率P=0.02<。即白葡萄酒整体评价结果有显著性差异。 (3)葡萄酒总体差异显著性分析 对亍白葡萄酒和红葡萄酒总体评价结果配对t检验。得到显著性概率 P=0.002< 即两组对整葡萄酒的评价有显著性差异。 3.5评分数据可信度评价 3.5.1数据可信度评价分析 前面我们已经对两组评酒员评价结果的差异显著性进行了分析,部分但指标 存在显著性差异,但两组评酒员对葡萄酒总体评价并无显著性差异。也即我们不 能通过显著性差异指标明显地看出哪一组评泙员的数据可信。因此比较两组评洒 员所评数据的可信度要建立更贴切的数据可信度指标。 3.5.2数据可信度评价指标建立 【实例截图】
【核心代码】
标签:
小贴士
感谢您为本站写下的评论,您的评论对其它用户来说具有重要的参考价值,所以请认真填写。
- 类似“顶”、“沙发”之类没有营养的文字,对勤劳贡献的楼主来说是令人沮丧的反馈信息。
- 相信您也不想看到一排文字/表情墙,所以请不要反馈意义不大的重复字符,也请尽量不要纯表情的回复。
- 提问之前请再仔细看一遍楼主的说明,或许是您遗漏了。
- 请勿到处挖坑绊人、招贴广告。既占空间让人厌烦,又没人会搭理,于人于己都无利。
关于好例子网
本站旨在为广大IT学习爱好者提供一个非营利性互相学习交流分享平台。本站所有资源都可以被免费获取学习研究。本站资源来自网友分享,对搜索内容的合法性不具有预见性、识别性、控制性,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,平台无法对用户传输的作品、信息、内容的权属或合法性、安全性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论平台是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二与二十三条之规定,若资源存在侵权或相关问题请联系本站客服人员,点此联系我们。关于更多版权及免责申明参见 版权及免责申明
网友评论
我要评论