北京语料库检索使用说明 首 页 一 关于CCL语料库及其检索系统 二 关于查询表达式 2
1 特殊符号 2
2 基本项 2
3 简单项 2
4 复杂项 2
5 过滤项 2
6 子句 2
7 查询表达式 三 关于查询结果 四 在结果中查找 五 举例 一 关于CCL语料库及其检索系统 1
1 CCL语料库及其检索系统为纯学术非盈利性的
不得将本系统及其产生的检索结果用于任何商业目的
CCL不承担由此产生的一切后果
2 本语料库仅供语言研究参考之用
语料本身的正确性需要您自己加以核实
3 语料库中所含语料的基本内容信息可以在“高级搜索”页面上,点击相应的链接查看
比如: “作者列表”:列出语料库中所包含的文件的作者 “篇名列表”:列出语料库中所包含的篇目名 “类型列表”:列出语料库中文章的分类信息 “路径列表”:列出语料库中各文件在计算机中存放的目录 “模式列表”:列出语料库中可以查询的模式 1
4 语料库中的中文文本未经分词处理
5 检索系统以汉字为基本单位
6 主要功能特色: 支持复杂检索表达式(比如不相邻关键字查询,指定距离查询,等等); 支持对标点符号的查询(比如查询“
”可以检索语料库中所有疑问句); 支持在“结果集”中继续检索; 用户可定制查询结果的显示方式(如左右长度,排序等); 用户可从网页上下载查询结果(text文件); 二 关于查询表达式 本节对CCL语料库检索系统目前支持的查询表达式加以说明
1 特殊符号 查询表达式中可以使用的特殊符号包括 7个: | $ # + - ~
这些符号分为三组: Operator1: | Operator2: $ # + - ~ Operaotr3:
符号的含义如下: (一) Operator1: Operator1是二元操作符,它的两边可以出现“基本项”(关于“基本项”