一 关于CCL 语料库及其检索系统 (如果时间紧张,可直接跳到最后的举例部分!) 1.1 CCL 语料库及其检索系统为纯学术非盈利性的。不得将本系统及其产生的检索结果用于任何商业目的。CCL 不承担由此产生的一切后果。 1.2 本语料库仅供语言研究参考之用。语料本身的正确性需要您自己加以核实。 1.3 语料库中所含语料的基本内容信息可以在“高级搜索”页面上,点击相应的链接查看。比如: “作者列表”:列出语料库中所包含的文件的作者 “篇名列表”:列出语料库中所包含的篇目名 “类型列表”:列出语料库中文章的分类信息 “路径列表”:列出语料库中各文件在计算机中存放的目录 “模式列表”:列出语料库中可以查询的模式 1.4 语料库中的中文文本未经分词处理。 1.5 检索系统以汉字为基本单位。 1.6 主要功能特色: • 支持复杂检索表达式(比如不相邻关键字查询,指定距离查询,等等); • 支持对标 点符 号 的查询(比如查询“? ”可以检索语料库中所有 疑 问 句 ); • 支持在“结果集 ”中继 续 检索; • 用户 可定制 查询结果的显 示 方 式(如左 右 长 度 ,排 序 等); • 用户 可从 网 页上下 载 查询结果(text 文件); 二 关于查询表达式 本节 对CCL 语料库检索系统目前 支持的查询表达式加以说 明 。 2.1 特殊 符 号 查询表达式中可以使 用的特殊 符 号 包括8 个 : | $ # + - ~ ! : 这 些 符 号 分为四 组 : Operator1: | Operator2: $ # + - ~ Operaotr3: ! Delimiter: : 符号的含义如下: (一) Operator1: Operator1 是二元操作符,它的两边可以出现“基本项”(关于“基本项”的定义见 2.2) (1) | 相当于逻辑中的“或”关系。 (二) Operator2:Operator2 是二元操作符,它的两边可以出现“简单项”(关于“简单项”的定义见 2.3) (2) $ 表示它两边的“简单项”按照左边在前、右边在后的次序出现于同一句中。两个“简单项”之间相隔字数小于或等于 Number (3) # 表示它两边的“简单项”出现于同一句中,不考虑前后次序。两个“简单项”之间相隔字数小于或等于 Number (4) + 表示它两边的“简单项”按照左边在前、右边在后的次序出现于同一句中。两个“简单项”之间相隔字数刚好等于 Number (5) - 表示它左边的“简单项”出现于句子中,并且,在右边相隔Number 个字...