1 国家哲学社会科学 “九五”规划项目 中国学习者英语语料库 桂诗春 杨惠中 广东外语外贸大学 上海交通大学 国外语言学及应用 语言文字工程研究所 语言学研究中心 上海外语教育出版社 2 目录 前言 I
中国学习者英语语料库 一 导言 二 CLEC 的建立 三 CLEC 的统计分析 四 中国学习者言语失误统计分析 II
词频排列(按频数)表 III
拼写失误表 IV
词频分布表 VI
语法标注频数表 (附 Lob134 个语法标注的说明与例子) VII
言语失误表 3 I.中国学习者英语语料库 一
导言 中国学习者英语库(Chinese Learner English Corpus,CLEC)是国家社科基金95 规划项目“基于语料库的中国学习者英语错误分析”(Corpus-based Analysis of Chinese Learner English,CBACLE)的一个重要组成部分
本书所载的是CLEC 的各种统计资料和列表;对中国学习者英语错误的各种分析另收集在《中国学习者英语错误分析》一书里
两书为姐妹篇,供读者互相引证
在某种意义上说,语料库语言学是一种研究方法; 而这种研究方法是借助计算机来实现的,故 Leech(1998a)主张把语料库语言学(corpus linguistics)说成是计算机语料库语言学(computer corpus linguistics)
随着计算机的普及和现代技术(高速的中央处理器、精密的扫描仪和字母识别程序、大容量硬盘等等)的发展,这种研究方法在最近20~30 年有了很大的发展
McEnery & Wilson(1996)对使用语料库方法来进行语言学研究的发展归纳如表1
根据英国Lancaster大学Taylor, Leech & Fligelstone 等人在 1989 年的统计,英语的机读语