百度搜索结果页url参数详解
在百度首页输入任意关键词搜索之后,我们跳转到搜索结果页面,在浏览器的网址栏我们可以看到很长的一串url地址。那么,你真的了解这一串url的含义吗?
s?:搜索
百度搜索结果页使用了重定向,因此我们看到的不是search.php?这样的url格式
wd:当前搜索的关键词
即输入的关键词的urlencode字符串,编码格式为gbk或者utf-8,默认编码格式为utf-8。用于作为搜索原料,百度还会经过分词、判类等操作,不是直接检索数据库,这个会在后面的破译百度系列当中详细讲解。
bs:上一次搜索的关键词
内容格式与当前搜索的关键词一致。用于记录用户的搜索行为,记录该值被用于相关关键词统计、同义词分析等操作。
rsv_spt:用户浏览器类型
值为1或者3(暂时只统计到这两个值)。用于标记用户当前使用的浏览器,IE内核浏览器为1,非IE内核为1,不过现在这个参数恒为3,还没有了解到时停用了还是改作他用。
rsv_bp:判断是第几次搜索
值为0或者1。当用户第一次搜索时,该参数值为0;当用户在第一次搜索的结果页进行第二次搜索或者更多次数搜索时,该参数值为1。用于记录用户的搜索行为,记录该值被用于校验搜索结果质量以及相关搜索词相关数据分析。
tn:搜索来源
该值为网站标记。例如从hao123的百度输入框搜索内容,将出现tn=sitehao123。记录该值被用百度统计搜索来源,该来源数据可能被作为决策数据。
inputT:键入时间
从打开百度页面开始到点击搜索按钮的时长。该参数被用于记录用户搜索行为。
oq:相关搜索的主词
例如搜索seo是什么,在底部的相关关键词当中有淘宝seo是什么意思,当点击后oq的值就是seo是什么。该参数主要用于相关词统计以及用户搜索行为记录。
rsp=第n+1次相关搜索
统计相关搜索的次数,例如是第4次相关搜索,那么rsp的值为3。该参数主要用于相关词统计以及用户搜索行为记录。
f:搜索行为判断
8为用户自主搜索,3为下拉框推荐,1为相关搜索。该参数主要用于用户搜索行为记录以及关键词统计。
pn:页码
值为公差为10的等差数列。用于页码判断,同时也用于校验搜索结果质量。
cl:搜索类型
值为3时是网页搜索,其他的值所对应的类型暂时还没有统计到。该值会影响搜索结果排序。
lm:指定时间内百度收录情况查询
值为1时是最近24小时;值为7时是最近7天;值为30时是最近1个月;值为360时是最近1年。
rn:搜索结果显示条数(Record Number)
取值范围在10~100条之间,缺省值为10。
ie:查询输入文字的编码
此项设置会影响搜索参数wd的编码类型。
si:在限定的域名中搜索
主要用于检索某个站点的百度索引数据,例如想要只得到百度的搜索结果,那么参数的值为baidu.com。使这个参数有效必须结合ct参数一起使用。
ct:此参数的值一般是一串数字
估计应该是搜索请求的验证码,目的暂时还没有分析出来。
百度搜索结果页url参数详解的更多相关文章
- mysql:JDBC url 参数详解
MySql链接url参数详解 jdbc:mysql://[host:port],[host:port].../[database][?参数名1][=参数值1][&参数名2][=参数值2]... ...
- MySql 链接url 参数详解
最近 整理了一下网上关于MySql 链接url 参数的设置,有不正确的地方希望大家多多指教: mysql JDBC URL格式如下: jdbc:mysql://[host:port],[host:po ...
- 百度url 参数详解全
百度url解析Joe.Smith整理大全 百度url解析Joe.Smith整理大全...1 本文链接:http://blog.csdn.net/qq_26816591/article/details/ ...
- apache url rewrite 的RewriteRule参数详解
apache url rewrite 的RewriteRule参数详解 我们经常会在apache那边对一些url进行一些重写操作,那么就会涉及到很多的重写策略的选择,比如重定向的方式,参数的处理,规则 ...
- (转)Linux curl命令参数详解
Linux curl命令参数详解 命令:curl在Linux中curl是一个利用URL规则在命令行下工作的文件传输工具,可以说是一款很强大的http命令行工具.它支持文件的上传和下载,是综合传输工具, ...
- Nginx主配置参数详解,Nginx配置网站
1.Niginx主配置文件参数详解 a.上面博客说了在Linux中安装nginx.博文地址为:http://www.cnblogs.com/hanyinglong/p/5102141.html b.当 ...
- chattr的常用参数详解
chattr的常用参数详解 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 在实际生产环境中,有的运维工程师不得不和开发和测试打交道,在我们公司最常见的就是部署接口.每天每个人部署的 ...
- $.ajax()方法所有参数详解;$.get(),$.post(),$.getJSON(),$.ajax()详解
[一]$.ajax()所有参数详解 url: 要求为String类型的参数,(默认为当前页地址)发送请求的地址. type: 要求为String类型的参数,请求方式(post或get)默认为get.注 ...
- linux PHP 编译安装参数详解
linux PHP 编译安装参数详解 ./configure --prefix=/usr/local/php --with-config-file-path=/usr/local/php/etc -- ...
随机推荐
- xcode4.5.1、iphone5、ios6 使用记录
链接地址:http://blog.sina.com.cn/s/blog_6123f9650101dmo7.html 1.修改工程名:直接选中工程名点一下,就像修改名称夹名称一样简单了. 2.导入旧 ...
- Cocos2D-X扫盲之坐标系、锚点
一.引言 在Cocos2D-X的开发过程中,经常会碰到设置精灵位置的问题.而设置位置的过程,涉及到两个问题:第一是坐标系,包括原点的位置.X/Y坐标轴的方向灯:第二是基准点(Cocos2D-X中叫锚点 ...
- hdu4722之简单数位dp
Good Numbers Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others) Tot ...
- 【floyd】HDU 1874 畅通project续
之后的题解偏重有用/总结性质,尽量理解算法本身而不是题,时间复杂度什么的也能够放放. 非常久之前做过这个题,当时使用dijkstra做的,关于几个最短路算法,分类的话能够分为下面几种. 1.单源最短路 ...
- SQL 根据时间和打印状态抽取记录
1.首先要是没有打印的记录. 2.其次是要按照时间,时间是要按照倒序排列. 下载文件的URL and order by 上传时间 desc *是否打印,使用字段bit,0是没有打印,1是已经打印
- Oracle数据库索引使用及索引失效总结
容易引起oracle索引失效的原因很多: 1.在索引列上使用函数.如SUBSTR,DECODE,INSTR等,对索引列进行运算.需要建立函数索引就可以解决了. 2.新建的表还没来得及生成统计信息,分析 ...
- c++,初始化列表
类对象的构造顺序是这样的: a.分配内存,调用构造函数时,隐式/显示的初始化各数据成员 b.进入构造函数后在构造函数中执行一般计算 1.初始化类的成员有两种方式,一是使用初始化列表,二是在构造函数体内 ...
- EEPlat PaaS VS Saleforce force.com
综述 EEPlatPaaS和Saleforce的Force.com都是元数据驱动应用的解决方式.整体而言,Force.com提供了更上层的解决方式,屏蔽了SQL语句.数据库:EEPlat更加底层,有更 ...
- 解决Xcode 7编译错误:does not contain bitcode
连接地址:http://jingyan.baidu.com/article/8065f87f96cf462331249801.html 好不容易更新到Xcode 7.0.1,重新编译代码,报错: do ...
- 自己用h5写的转盘。写贴上来吧。
<!DOCTYPE html> <html> <head lang="en"> <meta charset="UTF-8&quo ...