Py thon 数 据 分 析 与应用题库 下 列 nltk 模 块 中 , 可 以 对 句 子 实 现 分 词 操 作 的 是 ( )
[单 选 题 ] * A、nltk
corpus B、nltk
tokenize(正确答案) C、nltk
stem D、nltk
tag 答案解析 :暂无解析 下 列 函数中 , 用于打开 NLTK 下 载器的 是 ( )
[单 选 题 ] * A、download()(正确答案) B、load() C、open() D、install() 答案解析 :暂无解析 下 列 选 项中 , NLTK 用来标记形容词 的 是 ( )
[单 选 题 ] * A、JJ(正确答案) B、RB C、CC D、DT 答案解析 :暂无解析 关于词 性归一化的 说法中 , 下 列 描述正确的 是 ( )
[单 选 题 ] * A、词 干提取和词 形还原最终都会得到词 根 B、词干提取能够捕捉基于词根的规范单词形式 C、词形还原需要删除不影响词性的词缀得到词干 D、词形还原能够捕捉基于词根的规范单词形式(正确答案) 答 案 解 析:暂无解析 下列选项中,用于控制 jieba
cut()分词模式的是()
[单选题] * A、data B、HMM C、is_all D、cut_all(正确答案) 答 案 解 析:jieba
cut()函数共接收三个参数,其中第一个为需要分词的字符串,cut_all 参数用来控制是否采用全模式,HMM 参数用来控制是否使用 HMM 模型
下列方法中,用于返回出现相对较频繁的单词的是()
[单选题] * A、word_tokenize() B、pos_tag() C、most_common()(正确答案) D、cosine_distance() 答 案 解 析:word_tokenize()函数基于空格或标点对文