在处理英文文本时,由于英文文本天生自带分词效果,可以直接通过词之间的空格来分词(但是有些人名.地名等需要考虑作为一个整体,比如New York).而对于中文还有其他类似形式的语言,我们需要根据来特殊处理分词.而在中文分词中最好用的方法可以说是jieba分词.接下来我们来介绍下jieba分词的特点.原理与及简单的应用 1.特点 1)支持三种分词模式 精确模式:试图将句子最精确的切开,适合文本分析 全模式:把句子中所有的可以成词的词语都扫描出来,速度非常快,但是不能解决歧义 搜索引擎模式:在精确模式…