借鉴于 [jieba 模块文档] 用于自己学习和记录! jieba 模块是一个用于中文分词的模块 此模块支持三种分词模式 精确模式(试图将句子最精确的切开,适合文本分析) 全模式(把句子在所有可以成词的成语都扫描出来,速度非常快,但是不能解决歧义的问题) 搜索引擎模式(在精确模式的基础上,对长词再次切分,提高召回率) 主要功能 1. 分词 需要分词的字符串可以是 unicode 或 UTF-8 字符串.GBK 字符串.但是,不建议直接输入 GBK 字符串,可能无法预料地错误解码成 UTF-8 j…