关于google指令

关于google指令

google为我们准备好了的“指令”(directive),可以最大限度帮助我们完成每一次搜索。这些指令其实就是一个个关键字,能让我们从google的索引文件中更准确地提取信息。

如果我们希望google只显示来自于某个目标域名的相关搜索结果。这个时候,就需要用到“site:”指令。使用这条指令,google不但会返回于关键字相关的网页,而且只显示来自于某个具体网站的搜索结果。


想要正确使用google指令,需要输入三项内容:

  1. 你想要用的指令
  2. 半角冒号(:)
  3. 指令中要用到的具体的内容

输入这三项内容之后,接下来就和普通搜索没什么两样。要使用“site:”指令,需要在google搜索框中输入:

site:domain term(s) to search

注意指令/半角冒号和域名三者之间没有空格。如在达科他州立大学(Dakota State University)官方网站上搜索与Pat Engebretson有关的信息:

pat engebretson site:dsu.edu 

使用这条指令可以避免搜出一大堆不加区分的内容,可以将注意力集中到有用的搜索结果上。


注意:

google不区分大小写,所以不管输入“pat”,“Pat”还是“PAT”,结果都是一样。


另外,google的“intitle:”和“allintitle:”指令也很好用。

allintitle:”表示网页标题必须包含所有关键字才会出现在搜索结果里。

intitle:”不用包含全部关键字,只要包含任意一个关键字即可。

使用“allintitle:”指令执行google黑客攻击的经典例子是进行如下搜索:

allintitle:index of

执行该搜索,就能查看web服务器上的所有可用的索引目录列表。

如果想要搜索URL中包含某些特定字符的网站,可以使用”inurl:“指令。例如,如果执行下面这条命令,就有可能发现目标网站上许多有意思的页面:

inurl:admin

这条命令在发现目标网站的管理或设置页面方面极其有用。


提示:

搜索google的网页快照可能比搜索目标网站更有价值,因为这样做不但减少你在目标服务器上留下的痕迹,你的活动不容易受到跟踪,而且能有机会浏览原网站上已移除的网页和文件。只要是google爬虫抓取过的网页,都会在google网页快照中保存一个精简过的副本。重要的是要理解,这些网页快照不仅包含网站创建时所用到的代码,还会有爬虫抓取过程中发现的许多文件。这些文件的格式可能是PDF,也可能是word和excel等微软office文档文件或者文本文件等。


使用”cache:“指令就可以让google只显示网页快照里的信息。使用下面这条搜索命令就会显示网页快照里的Syngress主页:

cache:syngress.com

单击任何网址链接都会跳转到真实的网页,而不是快照版本的网页。如果你想浏览快照里的某些网页,就需要修改搜索命令。

使用”filetype:“指令可以搜索特定的文件扩展名,当你需要搜索目标网站上的特定类型文件时,这个指令就很有用。

例如,如果只是想搜索PDF文档,则可以执行下面这条命令:

filetype:pdf

用这个指令还能查找扩展名文.doc,xlsx,ppt,txt等。选择几乎是无限的,可以查找任意的文件类型。

想要获得更加强大的功能的话,可以在搜索时将多个指令搭配起来使用。例如,如果我们想找出达科他州立大学网站上所有的powerpoint演示文稿,可以在搜索框里输入以下命令:

site:dsu.edu filetype:ppt

关于Google指令(别提baidu)的更多相关文章

  1. 如何获取google地图、baidu百度地图的坐标

    google:打开google地图-->查找目的地-->右键:此位置居中-->地址栏键入javascript:void(prompt('',gApplication.getMap() ...

  2. Google地图,Baidu地图数据供应商

    http://janwen.iteye.com/blog/488659 Google百度  我老以为百度,Google的地图产品是自己开发的,原来是别人提供的数据, 百度的数据提供商有 北京世纪高通科 ...

  3. Google搜索命令语法大全

    以下是目前所有的Google搜索命令语法,它不同于Google的帮助文档,因为这里介绍 了几个Google不推荐使用的命令语法.大多数的Google搜索命令语法有它特有的使用格式,希望大家能正确使用. ...

  4. google打不开怎么办?谷歌打不开的解决方法

    www.ggfwzs.com 我是在这里安装插件,安装后可以打开google http://jingyan.baidu.com/article/b907e627d67ad646e6891c52.htm ...

  5. GOOGLE和百度的长域名

    GOOGLE的变态域名:www.mamashuojiusuannizhucedeyumingzaichanggoogledounengsousuochulai.cn/中文拼音:“妈妈说就算你注册的域名 ...

  6. Shell 管道指令pipe

    目录 管道命令pipe 选取命令 cut.grep cut 取出需要的信息 grep 取出需要行.过滤不需要的行 排序命令 sort.wc.uniq sort 排序 假设三位数,按十位数从小到大,个位 ...

  7. Linux文本查看及处理.md

    cat cat命令的用途是连接文件或标准输入并打印.这个命令常用来显示文件内容,或者将几个文件连接起来显示,或者从标准输入读取内容并显示,它常与重定向符号配合使用. 主要功能 一次显示整个文件:cat ...

  8. 理解Cookie和Session机制(转)

    目录[-] Cookie机制 什么是Cookie 记录用户访问次数 Cookie的不可跨域名性 Unicode编码:保存中文 BASE64编码:保存二进制图片 设置Cookie的所有属性 Cookie ...

  9. 理解Cookie和Session机制

    转载: 理解Cookie和Session机制 会话(Session)跟踪是Web程序中常用的技术,用来跟踪用户的整个会话.常用的会话跟踪技术是Cookie与Session.Cookie通过在客户端记录 ...

随机推荐

  1. Oracle初级入门 根据某字段重复只取一条记录,并计计算重复条数

    在平常开发中,去重复数据经常使用到,本人新手,接触Oracle也不久,开发中用到的小知识点,记录一下,老鸟可绕道,如果有写错的,请指正. 去重复记录可以使用distinct,当只查询一列数据时,可以轻 ...

  2. oracle&&Sqlserver获取表名列名主键及数据类型

    SQlserver获得列名,列类型,列类型长度,scale,prec等数据类型(syscolumns,systypes,sysobjects均为视图) select a.name as colname ...

  3. Java SE基础部分——常用类库之NumberFormat(数字格式化)

    数字格式化常用方法:DecimalFormat和NuberFormat. //2016060524 数字格式化学习 //数字格式化 两种方法 一种直接使用NumberFormat,另一种Decimal ...

  4. poj1323--贪心算法

    题意:一群人打牌包括你,每人出一张牌,谁最大,谁就算赢一局,问你最少能赢几局? 给出人数N,每人的牌数M,及你的牌. 分析:1.这题需比较大小,就像我们打牌时要将牌排序以便出牌,显然要先将手上的牌进行 ...

  5. css复合属性的写法

    # 复合属性也称为 "shortcut" property (快捷属性),它作用是为了简化代码,提高页面运行的效率. # 下面的内容会介绍 2 个比较常用的复合属性 "f ...

  6. python filter内建函数

    以下是filter函数的官方文档,注意最后一段,当function不为None时,函数相似于[item for item in iterable if function(item)],function ...

  7. 走进C标准库(3)——"stdio.h"中的getc和ungetc

    接前文. 再来看看getc和ungetc的实现.在看这两个函数的实现之前,我们先来想一想这两个函数分别需要做的工作. int getc(FILE *stream) 说明:函数getc从stream指向 ...

  8. MySQL read_only选项的作用

    1作用: 从字面意思上看就可以知道这个是把mysql设置为只读,但是这个只读只是针对一般用户而言的,对于root这种用super权限的用户read_only是没有用的. 2设置方式: set glob ...

  9. ArcEngine栅格和矢量渲染(含可视化颜色带)

    使用ArcEngine9.3开发的栅格和矢量的渲染. 开发环境:ArcEngine9.3,VS2008. 功能:栅格(拉伸和分级)和矢量(简单.唯一值.分级.比例)渲染. 开发界面如图所示. 图1 主 ...

  10. 一个SysLog实现

    http://www.ice.com/java/syslog/index.shtml http://alvinalexander.com/servlets