1 国家哲学社会科学“九五”规划项目中国学习者英语语料库桂诗春杨惠中广东外语外贸大学上海交通大学国外语言学及应用语言文字工程研究所语言学研究中心上海外语教育出版社2 目录前言I
中国学习者英语语料库一导言二CLEC 的建立三CLEC 的统计分析四中国学习者言语失误统计分析II
词频排列(按频数)表III
拼写失误表IV
词频分布表VI
语法标注频数表(附 Lob134 个语法标注的说明与例子)VII
言语失误表3 I.中国学习者英语语料库一
导言中国学习者英语库(Chinese Learner English Corpus,CLEC )是国家社科基金95 规划项目“基于语料库的中国学习者英语错误分析”(Corpus-based Analysis of Chinese Learner English ,CBACLE )的一个重要组成部分
本书所载的是CLEC 的各种统计资料和列表;对中国学习者英语错误的各种分析另收集在《中国学习者英语错误分析》一书里
两书为姐妹篇,供读者互相引证
在某种意义上说, 语料库语言学是一种研究方法; 而这种研究方法是借助计算机来实现的 , 故 Leech ( 1998a )主 张 把 语 料 库语 言 学 ( corpus linguistics )说成是计算机语料库语言学(computer corpus linguistics )
随着计算机的普及和现代技术(高速的中央处理器、精密的扫描仪和字母识别程序、大容量硬盘等等)的发展,这种研究方法在最近20~30 年有了很大的发展
McEnery & Wilson (1996)对使用语料库方法来进行语言学研究的发展归纳如表1
根据英国 Lancaster大学 Taylor, Leech & Fligelstone 等人在 1989 年的统计,英语的机读语料库当时已有36 种,非英语的有