google最近新开放出word2vec项目,该项目使用deep-learning技术将term表示为向量,由此计算term之间的相似度,对term聚类等,该项目也支持phrase的自动识别,以及与term等同的计算. word2vec(word to vector)顾名思义,这是一个将单词转换成向量形式的工具.通过转换,可以把对文本内容的处理简化为向量空间中的向量运算,计算出向量空间上的相似度,来表示文本语义上的相似度. 具体的原理还没有去了解,在这里谈一下怎么个应用法 分词 1) 本人下载…