提取文本的特征,把文本用特征表示出来,是文本分类的前提,使用sklearn做文本的特征提取,需要导入TfidfVectorizer模块. from sklearn.feature_extraction.text import TfidfVectorizer 一,使用sklearn做文本特征提取 sklearn提取文本特征时,最重要的两个步骤是:创建Tfidf向量生成器,把原始文档转换为词-文档矩阵. 使用TfidfVectorizer()函数创建向量生成器,最常用的参数是:stow_words=