N-最短路径 是中科院分词工具NLPIR进行分词用到的一个重要算法,张华平.刘群老师在论文<基于N-最短路径方法的中文词语粗分模型>中做了比较详细的介绍.该算法算法基本思想很简单,就是给定一待处理字串,根据词典,找出词典中所有可能的词,构造出字串的一个有向无环图,算出从开始到结束所有路径中最短的前N条路径.因为允许相等长度的路径并列,故最终的结果集合会大于或等于N. 根据算法思想,当我们拿到一个字串后,首先构造图,接着针对图计算最短路径.下面以一个例子“他说的确实在理”进行说明,开始为了能够简…