第二周 自然语言处理与词嵌入(Natural Language Processing and Word Embeddings) 2.1 词汇表征(Word Representation) 词汇表示,目前为止一直都是用词汇表来表示词,上周提到的词汇表,可能是 10000 个单词,我们一直用 one-hot 向量来表示词.这种表示方法的一大缺点就是它把每个词孤立起来,这样使得算法对相关词的泛化能力不强. 换一种表示方式会更好,如果不用 one-hot 表示,而是用特征化的表示来表示每个词,man,w…