2012高教社杯全国大学生数学建模竞赛编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):基于理化指标的葡萄酒评价分析模型摘要本文在利用主成分分析法提取出主成分理化指标后,结合偏最小二乘回归分析法建立了对葡萄和葡萄酒及其理化指标的相关分析和评价模型。对问题1,在对附件1表格中的酒样品序号按由小到大排序后,直接利用Excel中的函数命令,按每个评酒员对各项的打分进行求和,得到了每种酒样品的总评分。最后又对10名评酒员的各自总评分进行均值处理,得到了每种酒样品的平均得分和平均得分方差。从平均得分和平均得分方差的比较,不同葡萄酒平均得分的排序和图表三方面得出了两组结果均存在明显差异。后又通过方差和总体分布检验,结合图表得出的第二组结果更可信,并给出了红白葡萄酒的质量排序。在问题2中,首先将芳香物质视为葡萄的理化指标。再通过网上查询对一些重要的理化指标进行了预先排序,后对所有理化指标实施了主成分分析法,分别提取出了9种和10种主成分红白葡萄理化指标,累积贡献率均达到了85%,并给出了对红白葡萄的综合评价值及其排序,详见表7和表10。在问题3中,首先通过主成分分析法提取出了红白葡萄酒中的3种和4种主成分理化指标,与问题2中的红白葡萄主成分理化指标相互讨论,利用偏最小二乘回归分析法建立了两者之间联系关系式,并通过回归系数直方图和预测图进一步说明了建立的联系。下面是红葡萄与红葡萄酒理化指标的回归方程在问题4中,还是利用主成分分析法把得出的红白葡萄和葡萄酒的主成分理化指标,与可信度强的第二组红白葡萄酒的质量平均得分,视为自变量和因变量,通过偏最小二乘回归分析法,建立了两者之间的影响关系式,并结合回归系数直方图和预测图得出能够用葡萄和葡萄酒的理化指标来评价葡萄酒质量的结论。关键词:方差总体分布检验主成分分析法偏最小二乘回归分析法1问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:1.分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?2问题的分析2.1问题1对于第一问:要讨论两组评酒员评价结果的差异性,先对附件1中4个表格里的样酒按序号进行了由小到大的重新排序,因为它们排序都是打乱的,不方便实现差异性分析。其次,根据每个评酒员在打分后,求和得其总分来确定葡萄酒的质量得分。而葡萄酒在澄清度、色调等10个指标方面的总分又是一致的,在此直接利用Excel中函数命令按每个评酒员对各项的打分进行求和,得到了每种样酒的总评分。最后又对10名评酒员的各自总评分进行均值处理,得到了每种样酒的平均得分。由此还可求出10名评酒员各自总评分的方差,通过对平均得分和平均分方差的比较、排序,结合图表可对差异性实现分析。对于第二问:两组评酒员评价结果的可信度分析。利用第一问得出的平均得分和平均得分方差,通过数据比较之后,会有一组平均得分的方差要大,说明它的偏离程度就大,可信度就降低。为进一步对偏离程度进行分析,可对27种红葡萄酒和28种白葡萄酒的每名评酒员得分进行总体分布检验。因为它们的酒质量是未知的,方差也是未知的,属于非参数检验。故可直接利用Matlab工具箱中的normfit命令进行非参数检验的总体分布检验,来确定哪一组评价结果偏离程度大,实现可信度分析。2.2问题2首...