CLEC 收 集 了 包 括 中 学 生 、 大 学 英 语 4 级 和 6 级 、 专 业 英 语 低 年 级 和 高 年 级 在 内的 5 种 学 生 的 语 料 一 百 多 万 词 , 并 对 言 语 失 误 进 行 标 注 。 其 目 的 就 是 观 察 各 类 学生 的 英 语 特 征 和 言 语 失 误 的 情 况 , 希 望 通 过 定 量 和 定 性 的 方 法 对 中 国 学 习 者 英 语作 出 较 为 精 确 的 描 写 , 为 我 国 学 生 的 英 语 教 学 提 供 有 用 的 反 馈 信 息 。 表 1 CLEC 语 料 分 布 类型 词次 ST2 208088 ST3 209043 ST4 212855 ST5 214510 ST6 226106 总计 1070602 言语失误标注 原 则 1. 简 单 合 理 , 易 于 系 统 操 作 。 参 与 标 注 的 人 比 较 多 , 分 类 表 过 于 繁 复 , 就难 于 掌 握 。 我 们 采 取 两 级 分 类 , 第 一 级 有 11 类 : 词 形 ( fm) 、 动 词 短 语 ( vp) 、名 词 短 语 ( np) 、 代 词 ( pr) 、 形 容 词 短 语 ( aj) 、 副 词 ( ad) 、 介 词 短 语 ( pp) 、连 词 ( cj) 、 词 汇 ( wd) 、 搭 配 ( cc) 、 句 子 ( sn) 。 每 一 类 里再用 数目 字细分 。如[cc]为 词 语 搭 配 不当, [cc1]表 示名 词 和 名 词 的 搭 配 , [cc2]表 示名 词 和 动 词 的搭 配 , [cc3]表 示动 词 和 名 词 的 搭 配 , 等等。 2. 分 类 表 的 类 别要适中 。 过 粗容 易 统 一 , 但信 息 太少, 不利于 分 析学 习 者的 失 误 /过 细难 以统 一 , 容 易 把同一 种 失 误 归到不同类 别。 目 前我 们 采 取 的 办法是 对 常见的 失 误 从细( 如vp 和 np 都有 9 小类 ) , 对 少见的 失 误 从粗( 如cj 只有 两 小类 ) 。 现在 的 分 类 表 有 61 个失 误 码, 是 属于 中 等规模的 分 类 表 。 提 供 足够的 失 误 信 息( 失 误 本身、失 误 类 型和 失 误 发生 范围)。例如In the past, people are [vp6, 4-] kind to each other…, 失 误 用 方 括 号表 示, 放在...