PageRank 1.    概念 2.    原理   3.    java代码实现思路   1.定义收敛标准     每次算出新的pr-oldpr=差值 ,所有页面的差值累加 ,除以pagecount,得到avg差值 ,如果.小于0.01 2.计算总页面数,并且算出每个页面的初始pr值=1/pagecount 3.     A  0.25 B  D ----- A  0.35 B D--- A  0.29 B D----   数据集:   一个MapReduce(如何做到循环)     1.…
ItemCF_基于物品的协同过滤 1.    概念 2.    原理 如何给用户推荐? 给用户推荐他没有买过的物品--103 3.    java代码实现思路 数据集: 第一步:构建物品的同现矩阵 第二步:构建用户的得分矩阵 第三步:同现矩阵*评分矩阵 第四步:拿到最终结果,排序,得到给用户的推荐列表   问题一:物品同现矩阵和用户得分矩阵如何构建? 问题二:矩阵相乘如何来做?   六个MapReduce step1_第一个MapReduce: 目的-->去重去除数据集中重复的数据     第一…
spring-mvc实现模拟数据到网页展示过程代码 先看看我们的3种模拟数据到网页展示的思路图: 1.当mybatis的环境配置完成.一个动态Web项目建立好.开始导入jar包. -spring的aop,aspects,context,beans,core,expression,jdbc,tx,web,webmvc jar包导入 -log4j 核心包2个 -aopjar包:aopaliance-1.0jar,aspectjweaver-1.8.10jar -jstl.jar,standard.j…
网页排名算法PageRank PageRank,网页排名,又叫做网页级别.是一种利用网页之间的超链接数据进行计算的方法.它是由Google的两位创始人提出的. 对于用户而言,网页排名一般是比较主观的,但也存在一些方法可以给出较为客观的排名,PageRank就是其中一种.它衡量的是网页之间的相对重要性,把每一个网页当成一个图结点,网页之间的超链接当成是结点之间的边,根据结点之间的链接关系来进行计算的,核心思想是一个网页被链接的次数越多,那么它就越受关注. 1.简单PR模型 假设有这样几个网页的图,…
公号:码农充电站pro 主页:https://codeshellme.github.io 在互联网早期,随着网络上的网页逐渐增多,如何从海量网页中检索出我们想要的页面,变得非常的重要. 当时著名的雅虎和其它互联网公司都试图解决这个问题,但都没能有一个很好的解决方案. 直到1998 年前后,两位斯坦福大学的博士生,拉里·佩奇和谢尔盖·布林一起发明了著名的 PageRank 算法,才完美的解决了网页排名的问题.也正是因为这个算法,诞生了伟大的 Google 公司. (上图中:左为布林,右为佩奇.)…
搜索引擎的结果取决于两组信息:网页的质量信息,这个查询与每个网页的相关性信息.这里,我们介绍前一个. 1.PageRank算法原理 算法的原理很简单,在互联网上,如果一个网页被很多其他网页所链接,说明它收到普遍的承认和信赖,那么它的排名就高.比如我们要找李开复博士,有100个人举手说自己是李开复,那么谁是真的呢?如果大家都说创新工厂的那个是真的,那么他就是真的.这就是所谓的民主表决.但是,那么多网页,我们不可能一样对待.有些可靠的链接,相应的权重就要大一点.但是麻烦来了,一开始的时候,我们怎么给…
设计达人 http://www.shejidaren.com/30-minimal-app-icons.html CSS栅格: <!DOCTYPE html> <html lang="en"> <head> <meta charset="utf-8"> <meta http-equiv="X-UA-Compatible" content="IE=edge"> <…
网页嵌入WMP代码 播放器代码解释,装了9.0或9.0以上的播放器才能正常使用: OBJECT id="WMP" height="176" width="267" classid="clsid:6BF52A52-394A-11D3-B153-00C04F79FAA6" VIEWASTEXT> <PARAM NAME="URL" VALUE="mms://211.157.113.102/…
网页跳转的意思就是指当你在浏览器中访问A页面时,会自动跳转到B页面,往往网页跳转用在404页面中会比较多点.至于怎么实现网页跳转,网上已经提供了很多的方法,有些方法是不可行的,经过测试,叶德华今天就在这里提供PHP中常用的几种网页跳转代码,其中有些方法并不只是适用于PHP,也可以经过相应的修改应用到其他地方. 1.使用header()函数 在php页面的最开头输入如下代码: <?php header("location:http://www.yedward.net"); ?>…
TF-IDF 1.    概念   2.    原理   3.    java代码实现思路 数据集:   三个MapReduce 第一个MapReduce:(利用ik分词器,将一篇博文,也就是一条记录中的content进行词的拆分)     第一个MapReduce最终运行的结果:                                    1. 得到数据集中微博的总数:                                    2. 得到每个词在当前所属微博的TF值   …