转载请注明出处:http://www.cnblogs.com/zz-boy/p/3648878.html 更多精彩文章在:http://www.cnblogs.com/zz-boy/ 最近看了Google在 WWW2007上发表的Scaling Up All Pairs Similarity Search,觉得还不错,分享一下作者的思路. 在基于用户协同过滤方法的推荐系统中,用户相似度的计算是最终推荐的基础步骤:用户向量是用户的行为向量,其每一维度是物品,值是用户对该物品的喜爱程度,这种场景尤其
1. 词向量上的操作(Operations on word vectors) 因为词嵌入的训练是非常耗资源的,所以ML从业者通常 都是 选择加载训练好 的 词嵌入(Embedding)数据集.(不用自己训练啦~~~) 任务: 导入 预训练词向量,使用余弦相似性(cosine similarity)计算相似度 使用词嵌入来解决 "Man is to Woman as King is to __." 之类的 词语类比问题 修改词嵌入 来减少它们的性别歧视 import numpy as n
MPI是一个跨语言的通讯协议,用于并发编程.MPI标准定义了一组具有可移植性的编程接口. 安装环境 MPICH 是开源的消息传递接口(MPI)标准的实现. 下载地址 # 解压文件 tar -xzvf mpich-3.2.1.tar.gz cd mpich-3.2.1 # /usr/local/Cellar/mpich 改为你要安装 MPICH 的路径 ./configure –-prefix=/usr/local/Cellar/mpich |& tee c.log make |& tee