“HSK 动态作文语料库”语料标注及代码说明 “HSK 动态作文语料库”从字、词、句、篇、标点符号等角度,对所收入的作文语料中存在的外国人使用汉语的中介语偏误进行全面标注
1 、字处理(包括标点符号) [C]:错字标记,用于标示考生写的不成字的字
用[C]代表错字,在[C]前填写正确的字
例如:地球[C](“球”是错字)、这[C]
:别字标记,用于标示把甲字写成乙字的情况
别字包括同音的、不同音而只是形似的、既不同音也不形似但成字的等等
把别字移至中B 的后面,并在前填写正确的字
例如:提[B 题]高、考虑[B 虎]
[L]:漏字标记,用于标示作文中应有而没有的字
用[L]表示漏掉的字,并在[L]前填写所漏掉的字
例如: 后悔[L],表示“悔”在原文中是漏掉的字
农[L]药,表示“农”在原文中是漏掉的字
[D]:多字标记,用于标示作文中不应出现而出现的字
把多余的字移至[D]中D 的后面
例如:我的[D 的],表示括号中的“的”是多余的字(原文中写了两个“的”)
[F]:繁体字标记,用于标示繁体字
把繁体字移至[F]中F 的后面,并在[F]前填写简体字
例如:记忆[F 憶]、单{F 單}纯、养{F 養}分{F 份}
注意: 1)繁体字标记标示的是使用正确的繁体字,如果该繁体字同时又是别字,则先标繁体字标记,再标别字标记
例如:俭朴[F 樸[B 僕]]
2)繁体字写错了,标为:后[F 後[C]]
[Y]:异体字标记,用于标示异体字
把异体字移至[Y]中Y 的后面,并在[Y]前填写简体字
例如:偏[Y 徧]、沉[Y 沈]
[P]:拼音字标记,用于标示以汉语拼音代替汉字的情况
把拼音字移至[P]中P 的后面,并在[P]前填写简体字
例如:缘[Pyúan]分、保护[Phù]
[#]:无法识别的字的标记,用于标示无法识别的字
每个不可识别的字用一