2021年全国⾼考⼄卷语⽂试题及答案解析2021年全国⾼考⼄卷语⽂试题试卷副标题考试范围:xxx;考试时间:100分钟;命题⼈:xxx⼀、论述类⽂本阅读阅读下⾯的⽂字,完成下⾯⼩题
对于⼈⽂研究来说,计算⽅法以往只是作为辅助⼿段⽽存在的,⽽今天已取得了不可替代的地位
⼀种新的⼈⽂研究形态应运⽽⽣,这就是“数字⼈⽂”
学者莫莱蒂曾设想⼀种建⽴在全部⽂学⽂本之上的世界⽂学研究,⼈们必须借助计算机对⼤规模的⽂学⽂本集合进⾏采样、统计、图绘,分类,描述⽂学史的总体特征,然后再做⽂学评论式的解读
为此,他提出了与“细读”相对的“远读“作为⽅法论
弄清计算机的远读与⼈的细读之间的差别,不仅能使我们清晰地界定计算⽅法在⼈⽂研究中的作⽤,⽽且可以帮助我们重新确⽴⼈的阅读的价值
计算机是为科学计算⽽创造出来的,擅长的是“计数”,⽽⾮理解
要处理⾃然语⾔⽂本,计算机必须先将⽂本置换成便于计数的词汇集合,或者⽤更复杂的代数模型和概率模型来表⽰⽂本,这⼀过程被称为“数据化”
数据化之后所得到的⽂本替代物(集合、向量、概率)虽然损失了原始⽂本的丰富语义,但终究是可以计算的了
不过,尽管计算机能处理海量的语料,执⾏复杂的统计、分类、查询等任务,但它并不能理解⽂本的内容
远读是数字⼈⽂的基⽯
⼤规模的⽂本集合上的远读,基本上可以归为两类:⼀是对⽂本集合整体统计特征的描述,⼀是对⽂本集合内在结构特征的揭⽰
例如,数字⼈⽂学者⽶歇尔等⼈对数百万册数字化图书进⾏多种词汇和词频统计,以分析英语世界的语⾔演变,这属于前者;莫莱蒂⽤地图、树结构来分别展⽰⽂学作品的地理特征和侦探故事的类型结构,这属于后者
⽆论是宏观统计描述还是内在结构揭⽰,都是超越⽂本具体内容的抽象表⽰,所得结果都是需要解读的
正如⽶歇尔所说,在巨量⽂本集合上得到的统计分析结果,为⼈⽂材料的宏观研究提供了证据;但是要解读这些证据,就像分析古代⽣物化