能够充分意识到W的这些属性不过是副产品而已是很重要的.我们没有尝试着让相似的词离得近.我们没想把类比编码进不同的向量里.我们想做的不过是一个简单的任务,比如预测一个句子是不是成立的.这些属性大概也就是在优化过程中自动蹦出来的. 这看来是神经网络的一个非常强大的优点:它们能自动学习更好的数据表征的方法.反过来讲,能有效地表示数据对许多机器学习问题的成功都是必不可少的.word embeddings仅仅是学习数据表示中一个引人注目的例子而已. word embeddings就是会把相似的词聚到一起,…