一.WhitespaceAnalyzer 以空格作为切词标准,不对语汇单元进行其他规范化处理.很明显这个实用英文,单词之间用空格. 二.SimpleAnalyzer 以非字母符来分割文本信息,并将语汇单元统一为小写形式,并去掉数字类型的字符.很明显不适用于中文环境. 三.StopAnalyzer 停顿词分析器会去除一些常有a,the,an等等,也可以自定义禁用词,不适用于中文环境 四.StandardAnalyzer 标准分析器是Lucene内置的分析器,会将语汇单元转成小写形式,并去除停用词及…