分词器概念介绍: Analyzer类(分词器)就是把一段文本中的词按某些规则取出,提供和以后查询时使用的工具类,注意在创建索引时会用到分词器,在使用字符串搜索时也会用到分词器,这两个地方要使用同一个分词器,否则可能会搜索不出结果 分词器工作流程: 1, 切分关键词 2, 去除停用词 3, 对于英文单词,把所有字母转为小写(搜索时不区分大小写) 停用词: 有些词在文本中出现的频率非常高,但是对文本所携带的信息基本不产生影响,例如英文的“a.an.the.of”,或中文的“的.了.着.是”,以及各种