中心词抽取项目总结 B2B国际站Query重写.ppt 达观数据搜索引擎的Query自动纠错技术和架构详解 Natural Language Processing Simrank++ Query rewriting through link analysis of the click graph Probabilistic Query Rewriting for Efficient and Effective Keyword Search on Graph Data.1642-1653 Deep
1.简单了解搜索引擎收录的原理 包括baidu. google .yahoo 在内的各大搜索引擎在内基本上搜录网站的原理大致相同(除了国内某些网站 网1新 l 等采取人工登记的办法),搜索引擎都是采用自己的算法在网络上遍历搜索,一般靠有效的连接和网页的跳转访问地址,同时也登记网站的<title>和<meta>,并对一部分关键字进行屏蔽.遍历的结果也要进行筛选,重复的网址和不可靠的<title>甚至网页内容会被删除.并定时更新搜索引擎的数据. 百度: http://ww