lucene_02_IKAnalyre】的更多相关文章

前言 在lucene中虽然已经提供了许多的分词器:StandardAnalyzer.CJKAnalyzer等,但在解析中文的时候都会把文中拆成一个个的单子. 毕竟老外不懂中文.这里介绍一个中文的分词器:IKAnalyre.虽然在其在分词的时候还不够完美 例如:将“高富帅,是2012年之后才有的词汇” 拆分为下图: 但是它可以通过配置文件来,增加新词和过滤不许出现的词比如:“的.啊.呀”等等没有具体意思的修饰副词和语气词等等. 配置IK解析器 第一步:在pom.xml 引入IK,注意:这个分词器由…