学习视频来自:Youtube 学习文档来自:简书 NLTK:自然语言工具包 目的:将段落拆分为句子.拆分词语,识别这些词语的词性,高亮主题,帮助机器了解文本关于什么.这个小节将解决意见挖掘或情感分析的领域 一.分析单词或句子 常见简单词汇,希望快速掌握吧: 语料库Corpus:文本的正文,理解为电子文本库,corpora是其复数形式 词库Lexicon:词汇及含义 标记Token:拆分出来的东西.每个实体都是根据规则分割的一部分,一个句子被拆分成单词时,每个单词都是一个标记,如果拆分成句子,则句…