之所以研究这个算法,是因为最近在研究NLP中文的分词,所谓分词就是将一个完整的句子,例如“计算语言学课程有意思”,分解成一些词组单元“计算语言学,课程,有,意思”. “最大匹配法” 在中文分词中有所应用,因此这里介绍一下. “最大匹配法” 分为正向匹配和逆向匹配,这里先看正向匹配. 算法思想: 正向最大匹配算法:从左到右将待分词文本中的几个连续字符与词表匹配,如果匹配上,则切分出一个词.但这里有一个问题:要做到最大匹配,并不是第一次匹配到就可以切分的 .我们来举个例子: 待分词文本: sente…