主要思想 这篇文章主要是利用多个标准进行中文分词,和之前复旦的那篇文章比,它的方法更简洁,不需要复杂的结构,但比之前的方法更有效. 方法 堆叠的LSTM,最上层是CRF. 最底层是字符集的Bi-LSTM.输入:字符集embedding,输出:每个字符的上下文特征表示. 得到ht之后, CRF作为推理层. 打分: local score: 其中 ,,这一项是Bi-LSTM隐层ht和bigram 特征embedding的拼接. global score: A是转移矩阵tag yi to tag yj…