文本自动分类技术是文字管理的基础.通过快速.准确的文本自动分类,可以节省大量的人力财力:提高工作效率:让用户快速获得所需资源,改善用户体验.本文着重对KNN文本分类算法进行介绍并提出改进方法. 一.相关理论介绍 文本分类技术的研究由来已久,并且取得了很多可喜的成果,形成了一套完整的文本自动分类流程. (1)文本分类 文本分类是根据训练样本集中的样本来进行训练,找到一定的分类规则和规律,然后根据这些规则和规律对需要进行分类的文本进行判断,自动将其归类. (2)文本表示 要实现依据内容的自动分类,需…