第一周: 学习PageRank, 知识点:每个节点的权值由其他节点的投票决定,所有节点的权值和为1 当节点很多时候必须转换成矩阵运算来计算节点的最终值,由马尔可夫链可以证明,这个值可以迭代得到 问题:可能出现无出度节点,导致总体失衡 解决办法:每个节点的入读权值矩阵M' = 0.8*M + 0.2*1/n,以0.2的概率跳出当前节点 第二周: minhashing h(i) 随机排列后,一列数据的第一个不为1的下标 用普通hash替代每个minhashing(hash出每行每列,在移动行中,确定…