声明:word2vec剖析,资料整理备存,以下资料均为转载,膜拜大神,仅作学术交流之用. word2vec是google最新发布的深度学习工具,它利用神经网络将单词映射到低维连续实数空间,又称为单词嵌入.词与词之间的语义相似度可以通过两个单词的嵌入向量之间的余弦夹角直接衡量.同时作者Tomas Mikolov发现了比较有趣的现象,就是单词经过分布式表示后,向量之间依旧保持一定的语法规则,比如简单的加减法规则. 1.将文本语料进行分词,以空格,tab隔开都可以,中文分词工具可以使用张华平博士的NL…