http://blog.csdn.net/whuslei/article/details/7398443 最近需要对英文进行分词处理,希望能够实现还原英文单词原型,比如 boys 变为 boy 等. 简介 发现一个不错的工具Porter stemmer,主页是http://tartarus.org/~martin/PorterStemmer/.它被实现为N多版本,C.Java.Perl等. 下面是它的简单介绍: Stemming, in the parlance of searching and
文章转载:http://blog.csdn.net/xiaoxiangzi222/article/details/53483931 jieba “结巴”中文分词:做最好的 Python 中文分词组件 "Jieba" (Chinese for "to stutter") Chinese text segmentation: built to be the best Python Chinese word segmentation module. Scroll down