关于google指令

关于google指令

google为我们准备好了的“指令”(directive),可以最大限度帮助我们完成每一次搜索。这些指令其实就是一个个关键字,能让我们从google的索引文件中更准确地提取信息。

如果我们希望google只显示来自于某个目标域名的相关搜索结果。这个时候,就需要用到“site:”指令。使用这条指令,google不但会返回于关键字相关的网页,而且只显示来自于某个具体网站的搜索结果。


想要正确使用google指令,需要输入三项内容:

  1. 你想要用的指令
  2. 半角冒号(:)
  3. 指令中要用到的具体的内容

输入这三项内容之后,接下来就和普通搜索没什么两样。要使用“site:”指令,需要在google搜索框中输入:

site:domain term(s) to search

注意指令/半角冒号和域名三者之间没有空格。如在达科他州立大学(Dakota State University)官方网站上搜索与Pat Engebretson有关的信息:

pat engebretson site:dsu.edu 

使用这条指令可以避免搜出一大堆不加区分的内容,可以将注意力集中到有用的搜索结果上。


注意:

google不区分大小写,所以不管输入“pat”,“Pat”还是“PAT”,结果都是一样。


另外,google的“intitle:”和“allintitle:”指令也很好用。

allintitle:”表示网页标题必须包含所有关键字才会出现在搜索结果里。

intitle:”不用包含全部关键字,只要包含任意一个关键字即可。

使用“allintitle:”指令执行google黑客攻击的经典例子是进行如下搜索:

allintitle:index of

执行该搜索,就能查看web服务器上的所有可用的索引目录列表。

如果想要搜索URL中包含某些特定字符的网站,可以使用”inurl:“指令。例如,如果执行下面这条命令,就有可能发现目标网站上许多有意思的页面:

inurl:admin

这条命令在发现目标网站的管理或设置页面方面极其有用。


提示:

搜索google的网页快照可能比搜索目标网站更有价值,因为这样做不但减少你在目标服务器上留下的痕迹,你的活动不容易受到跟踪,而且能有机会浏览原网站上已移除的网页和文件。只要是google爬虫抓取过的网页,都会在google网页快照中保存一个精简过的副本。重要的是要理解,这些网页快照不仅包含网站创建时所用到的代码,还会有爬虫抓取过程中发现的许多文件。这些文件的格式可能是PDF,也可能是word和excel等微软office文档文件或者文本文件等。


使用”cache:“指令就可以让google只显示网页快照里的信息。使用下面这条搜索命令就会显示网页快照里的Syngress主页:

cache:syngress.com

单击任何网址链接都会跳转到真实的网页,而不是快照版本的网页。如果你想浏览快照里的某些网页,就需要修改搜索命令。

使用”filetype:“指令可以搜索特定的文件扩展名,当你需要搜索目标网站上的特定类型文件时,这个指令就很有用。

例如,如果只是想搜索PDF文档,则可以执行下面这条命令:

filetype:pdf

用这个指令还能查找扩展名文.doc,xlsx,ppt,txt等。选择几乎是无限的,可以查找任意的文件类型。

想要获得更加强大的功能的话,可以在搜索时将多个指令搭配起来使用。例如,如果我们想找出达科他州立大学网站上所有的powerpoint演示文稿,可以在搜索框里输入以下命令:

site:dsu.edu filetype:ppt

关于Google指令(别提baidu)的更多相关文章

  1. 如何获取google地图、baidu百度地图的坐标

    google:打开google地图-->查找目的地-->右键:此位置居中-->地址栏键入javascript:void(prompt('',gApplication.getMap() ...

  2. Google地图,Baidu地图数据供应商

    http://janwen.iteye.com/blog/488659 Google百度  我老以为百度,Google的地图产品是自己开发的,原来是别人提供的数据, 百度的数据提供商有 北京世纪高通科 ...

  3. Google搜索命令语法大全

    以下是目前所有的Google搜索命令语法,它不同于Google的帮助文档,因为这里介绍 了几个Google不推荐使用的命令语法.大多数的Google搜索命令语法有它特有的使用格式,希望大家能正确使用. ...

  4. google打不开怎么办?谷歌打不开的解决方法

    www.ggfwzs.com 我是在这里安装插件,安装后可以打开google http://jingyan.baidu.com/article/b907e627d67ad646e6891c52.htm ...

  5. GOOGLE和百度的长域名

    GOOGLE的变态域名:www.mamashuojiusuannizhucedeyumingzaichanggoogledounengsousuochulai.cn/中文拼音:“妈妈说就算你注册的域名 ...

  6. Shell 管道指令pipe

    目录 管道命令pipe 选取命令 cut.grep cut 取出需要的信息 grep 取出需要行.过滤不需要的行 排序命令 sort.wc.uniq sort 排序 假设三位数,按十位数从小到大,个位 ...

  7. Linux文本查看及处理.md

    cat cat命令的用途是连接文件或标准输入并打印.这个命令常用来显示文件内容,或者将几个文件连接起来显示,或者从标准输入读取内容并显示,它常与重定向符号配合使用. 主要功能 一次显示整个文件:cat ...

  8. 理解Cookie和Session机制(转)

    目录[-] Cookie机制 什么是Cookie 记录用户访问次数 Cookie的不可跨域名性 Unicode编码:保存中文 BASE64编码:保存二进制图片 设置Cookie的所有属性 Cookie ...

  9. 理解Cookie和Session机制

    转载: 理解Cookie和Session机制 会话(Session)跟踪是Web程序中常用的技术,用来跟踪用户的整个会话.常用的会话跟踪技术是Cookie与Session.Cookie通过在客户端记录 ...

随机推荐

  1. 解决ubuntu 14.04删ibus导致系统设置项目的损失后,,退出关机问题是不正常的

    已安装sogou第一篇文章.嫌ibus碍眼,习惯性删.我没想到会引起一系列问题.退出登录用户崩溃.系统设置非常多的项目. 它似乎ubuntu 14.04于ibus它不能被卸载(卸载iBus本身没有问题 ...

  2. 一个C/C++结构体初始化有趣的现象

    我们知道C语言当中结构可以使用{}进行初始化,例如有结构体定义如下: typedef struct type_t { int a; int b; int c; int d; }type_t; 我们可以 ...

  3. SharePoint webpart中悬浮窗口的webconfig路径

    SharePoint webpart中悬浮窗口的webconfig路径在.../_layouts/15/下.

  4. HTTP头信息(转)--2

    HTTP 头部解释 ========================================================================================== ...

  5. 关于中文乱码的解决方法(URL方式)

    假设keyWord ='阳光'; url="play.jsp? keyWord ="+ keyWord 若按照上述的地址直接访问,则中文会变成乱码.必须使用encodeURI()进 ...

  6. php使用正则

    $str = '2';echo preg_match('/^\d{1,10}$/i',$str);//匹配数字,最少1位,最多10位,返回1,否则返回0;

  7. echo向文件中写入

    echo命令向一个文件写入内容的方法详解,感兴趣的朋友可以参考下. 覆盖型写法 (文件里原来的内容被覆盖)echo "aaa" > a.txtecho aaa > a. ...

  8. C语言中头文件<stdio.h>中的#ifndef _STDIO_H_

    先了解这里的相关知识:http://www.cnblogs.com/stemon/p/4000468.html 头文件的中的#ifndef,这是一个很关键的东西.比如你有两个C文件,这两个C文件都in ...

  9. 项目中怎么去掉tomcat的猫

    其实很简单,需要在登录页和显示内容的主页,将自己的favicon.ico 导入,并在登录页和主页将其引入即可. 例如: 接着在登录页引入  <link rel="shortcut ic ...

  10. 深入A标签点击触发事件而不跳转的详解

    本文介绍下,当点击A标签时,触发事件但不跳转的实现方法,有需要的朋友参考下吧. 点击页面上的空链接,点击后页面自动刷新,并会定位到页面顶端. 不过,有时需要点击#页面但不作跳转,可以这样写: < ...