传统 CRF 中的输入 X 向量一般是 word 的 one-hot 形式,前面提到这种形式的输入损失了很多词语的语义信息.有了词嵌入方法之后,词向量形式的词表征一般效果比 one-hot 表示的特征要好.本文先主要介绍了LSTM.词嵌入与条件随机场,然后再从序列标注问题探讨 BiLSTM与CRF等的应用. Word Embedding 和 LSTM Word Embedding 简单的说是将高维空间(空间的维度通常是词典的大小)中的表示 word 的高维 one-hot 向量映射到低维(几十维…