2 0 1 3 高教社杯全国大学生数学建模竞赛(选拔赛) 承 诺 书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。 我们参赛选择的题号是(从A/B/C/D 中选择一项填写): 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 参赛队员 (打印并签名) :1. 2. 3. 指导教师或指导教师组负责人 (打印并签名): 日期: 年 月 日 赛区评 阅编 号(由 赛区组委 会 评 阅前 进 行编 号): 队 员 信 息 表 ( 必 须 如 实 填 写 ) 学号 姓 名 所属院 专 业 年级 电话 指导教师 是否 有笔记 本 201100800277 周 怡 数学与统 计 学院 统 计 学 2011 未 选定 201100820017 段 熙 玉 数学与统 计 学院 统 计 学 2011 未 选定 201000800138 林 阳 机 电与信 息 工 程 软 件工 程 2010 未 选定 注 : 如 未 选 定 指 导 教 师 可 不 填 写 “ 指 导 教 师 ” 一 栏 。 2 0 1 3 高教社杯全国大学生数学建模竞赛(选拔赛) 编 号 专 用 页 赛区评阅编号(由赛区组委会评阅前进行编号): 赛区评阅记录(可供赛区评阅时使用): 评阅人 评分 备注 全国统一编号(由赛区组委会送交全国前编号): 全国评阅编号(由全国组委会评阅前进行编号): 对《红楼梦》文本的计算机识别方法的研究与设计 摘 要 本文通过对文本人物关系、文本结构分层、作者行文风格的分析来分析中文文本。 针对问题一,我们运用聚类分析和层次分析建立模型从物理结构与逻辑结构两方面来分析文本,我们提取文本中和文本标题中的人名作为特征项,用 matlab 编程分别统计每个人名在各个段落中的频数。通过运用主成分分析法对文本进行的分析我们得出自变量与常数项几乎不相关,因此不需要采取主成分回归分析。通过系统聚类分析,我们得到了聚类图,从中得出了主演人物之...