本章是接前两篇<分词工具Hanlp基于感知机的中文分词框架>和<基于结构化感知机的词性标注与命名实体识别框架>的.本系统将同时进行中文分词.词性标注与命名实体识别3个任务的子系统称为“词法分析器”. 加载 对应的类为PerceptronLexicalAnalyzer,其构造方法为递增的3个模型地址: l public PerceptronLexicalAnalyzer(String cwsModelFile) throws IOException l public Perceptr
SRILM是一个建立和使用统计语言模型的开源工具包,从1995年开始由SRI 口语技术与研究实验室(SRI Speech Technology and Research Laboratory)开发,现在仍然不断推出新版本,被广泛应用于语音识别.机器翻译等领域.这个工具包包含一组C++类库.一组进行语言模型训练和应用的可执行程序等.利用它可以非常方便地训练和应用语言模型.给定一组连续的词,调用SRILM提供的接口,可以得到这组词出现的概率. http://www.jianshu.com/p/5b1