目标:用Python3写一款小型的web目录扫描工具

功能:1.扫描指定站点

   2.指定网站脚本类型来扫描

   3.可控线程

   4.可保存扫描结果

首先定义一个命令参数的函数

def parse_option():
    parser = argparse.ArgumentParser(description="The Argument of DirScan")
    parser.add_argument("-u","--url",dest="url",help="The Url to Scan")
    parser.add_argument("-e","--extensions",dest="extensions",help="Web Extensions")
    parser.add_argument("-t","--thread",dest="thread",default=10,type=int,help="The Thread to Scan")
    parser.add_argument("-r","--report",action="store_true",help="Save The Result of Scan")
    args = parser.parse_args()
    return args

定义了4个参数,-u用来指定扫描的url,-e用来指定网站类型,-t用来指定线程数,默认为10,-r为保存扫描结果

参数的值传入变量args,然后返回

然后定义一个开始的函数,对url进行处理和启用多线程

def start(url, ext, count):
    queue = Queue() #生成一个队列

    print('\033[34;1m   Status   Url Path\033[0m')

    global url_r #设置为全局变量

    #对传入的url进行处理
    if url.endswith("/"):
        url = url.rstrip("/")
    #对url进行处理方便写入结果
    if url[4] == 's':
        url_r = url.lstrip("https://")
    if url[4] == ':':
        url_r = url.lstrip("http://")

    #打开字典,并和url进行拼接
    f = open('%s.txt' %ext,'r')
    for i in f:
        queue.put(url + i.rstrip('\n'))

    threads = []
    thread_count = count

    for i in range(thread_count):
        threads.append(Dirscan(queue)) #调用多线程
    for t in threads:
        t.start() #开启多线程
    for t in threads:
        t.join()  #等待

这里用类方法来进行多线程的调用

class Dirscan(threading.Thread):
    def __init__(self,queue):
        threading.Thread.__init__(self)
        self.queue = queue

    def run(self):
        while not self.queue.empty():
            url_path = self.queue.get() #从队列里获取url

            #随机user-agents
            u = open("user-agents.txt", "r")
            headers_list = []
            random_headers = {}
            for i in u:
                headers_list.append(i.strip())
            random_headers["user-agents"] = random.choice(headers_list)
            headers = random_headers

            try:
                r = requests.get(url=url_path, headers=headers, timeout=6,allow_redirects=False)
                status_code = r.status_code
                if status_code == 200:
                    print("\033[32;1m[+]   [%s]    %s\033[0m"%(status_code,url_path))
                    if cmd_args.report: #如果有传入-r参数,则执行write_report()函数来写扫描结果
                        write_report(url_path)
                        return url_path
            except Exception as e:
                print("\033[41;1m%s\033[0m"%e)

然后是写扫描结果的函数

def write_report(url):
    with open("%s.html"%url_r, "a") as r:
        r.write('<a href="'+url+'" target="_blank">'+url+'</a><br>')
        r.close()

最后是程序的入口

if __name__ == '__main__':
    cmd_args = parse_option() #把parse_option()返回的args赋给变量cmd_args
    url = cmd_args.url #把args中的url传给变量url
    extension = cmd_args.extensions #把args中的extensions传给变量extension
    thread = cmd_args.thread #把args中的thread传给变量thread
    start(url,extension,thread) #把三个参数传入start()函数

以html格式保存扫描结果,也方便直接打开扫描结果

最后的完整代码

# -*- coding:utf-8 -*-
__author__ = "MuT6 Sch01aR"

import requests
import argparse
import threading
from queue import Queue
import random

class Dirscan(threading.Thread):
    def __init__(self,queue):
        threading.Thread.__init__(self)
        self.queue = queue

    def run(self):
        while not self.queue.empty():
            url_path = self.queue.get()
            u = open("user-agents.txt", "r")
            headers_list = []
            random_headers = {}
            for i in u:
                headers_list.append(i.strip())
            random_headers["user-agents"] = random.choice(headers_list)
            headers = random_headers
            try:
                r = requests.get(url=url_path, headers=headers, timeout=6,allow_redirects=False)
                status_code = r.status_code
                if status_code == 200:
                    print("\033[32;1m[+]   [%s]    %s\033[0m"%(status_code,url_path))
                    if cmd_args.report:
                        write_report(url_path)
                        return url_path
            except Exception as e:
                print("\033[41;1m%s\033[0m"%e)

def write_report(url):
    with open("%s.html"%url_r, "a") as r:
        r.write('<a href="'+url+'" target="_blank">'+url+'</a><br>')
        r.close()

def start(url, ext, count):
    queue = Queue()

    print('\033[34;1m   Status   Url Path\033[0m')

    global url_r
    if url.endswith("/"):
        url = url.rstrip("/")
    if url[4] == 's':
        url_r = url.lstrip("https://")
    if url[4] == ':':
        url_r = url.lstrip("http://")

    f = open('%s.txt' %ext,'r')
    for i in f:
        queue.put(url + i.rstrip('\n'))

    threads = []
    thread_count = count

    for i in range(thread_count):
        threads.append(Dirscan(queue))
    for t in threads:
        t.start()
    for t in threads:
        t.join()

def parse_option():
    parser = argparse.ArgumentParser(description="The Argument of DirScan")
    parser.add_argument("-u","--url",dest="url",help="The Url to Scan")
    parser.add_argument("-e","--extensions",dest="extensions",help="Web Extensions")
    parser.add_argument("-t","--thread",dest="thread",default=10,type=int,help="The Thread to Scan")
    parser.add_argument("-r","--report",action="store_true",help="Save The Result of Scan")
    args = parser.parse_args()
    return args

if __name__ == '__main__':
    cmd_args = parse_option()
    url = cmd_args.url
    extension = cmd_args.extensions
    thread = cmd_args.thread
    start(url,extension,thread)

Python打造一个目录扫描工具的更多相关文章

  1. 目录扫描工具 dirsearch 使用详解

    介绍 dirsearch 是一个python开发的目录扫描工具.和我们平时使用的dirb.御剑之类的工具一样,就是为了扫描网站的敏感文件和目录从而找到突破口. 特点 多线程 可保持连接 支持多种后缀( ...

  2. phantomjs + python 打造一个微信机器人

    phantomjs + python 打造一个微信机器人 1.前奏   媳妇公司不能上网,但经常需要在公众号上找一些文章做一些参考,需要的时候就把文章链接分享给我,然后我在浏览器打开网页,一点点复制过 ...

  3. 渗透测试工具篇之目录扫描工具dirmap

    (一)dirmap介绍 一个高级web目录扫描工具,功能将会强于DirBuster.Dirsearch.cansina.御剑 (二)dirmap安装 打开浏览器输入https://github.com ...

  4. python遍历一个目录,输出所有文件名

    python遍历一个目录,输出所有文件名 python os模块 os import os  def GetFileList(dir, fileList):  newDir = dir  if os. ...

  5. python之web路径扫描工具

    # coding: UTF-8 import sys, os, time, httplibimport relist_http=[]  #http数组 def open_httptxt():  #打开 ...

  6. Python读取一个目录下的所有文件

    #!/usr/bin/python # -*- coding:utf8 -*- import os allFileNum = 0 def printPath(level, path): global ...

  7. python 读取一个目录下的所有目录和文件

    #!/usr/bin/python # -*- coding:utf8 -*- import os allFileNum = 0 def printPath(level, path): global ...

  8. python 检索一个目录下所有的txt文件,并把文件改为.log

    检索一个目录及子目录下所有的txt文件,并把txt文件后缀改为log: import os f_path = r'C:\Users\PycharmProjects\mystudy\Testfolder ...

  9. python 删除一个目录下的所有文件

    一个目录下有文件,文件夹,文件夹里又有文件.文件夹....用python脚本,实现,递归删除一个目录下的所有文件: 目录结构如下: 其中我们要删除所有文件 代码实现如下: import os CUR_ ...

随机推荐

  1. 【codevs1028】花店橱窗布置(费用流)

    这几天刚学了费用流,找到了这道题来练一练手. 题目: 题目描述 Description 假设以最美观的方式布置花店的橱窗,有F束花,V个花瓶,我们用美学值(一个整数)表示每束花放入每个花瓶所产生的美学 ...

  2. POJ 1635 Subway tree systems (树的最小表示法)

    题意:一串01序列,从一个点开始,0表示去下一个点,1表示回到上一个点,最后回到起点,遍历这棵树时每条边当且仅当走2次(来回) 给出两串序列,判断是否是同一棵树的不同遍历方式 题解:我们把每一个节点下 ...

  3. Hbase- Hbase客户端读写数据时的路由流程

    1.客户端先到zookeeper查找hbase:meta所在的RegionServer服务器 2.去hbase:meta表查找自己所要的数据所在的region server 3.去目标region s ...

  4. c3p0 数据库连接池相关知识

    c3p0数据库连接池的配置文件放在eclipse的src目录下,代码就可以识别. c3p0的配置文件的内容如下: <!-- Uncomment and set any of the option ...

  5. Win7使用之查端口,杀进程

    对 Win7 的 cmd 使用不熟练,这里记录下经常用到的命令吧! 查看所有端口占用情况:netstat -ano 查看指定端口占用情况:netstat -ano | findstr "80 ...

  6. 微软面向高并发应用而推出的新程序库——TPL Dataflow

    TPL Dataflow库的几个扩展函数 TPL Dataflow是微软面向高并发应用而推出的新程序库.借助于异步消息传递与管道,它可以提供比线程池更好的控制.本身TPL库在DataflowBlock ...

  7. hzau 1210 Happiness

    1210: Happiness Time Limit: 1 Sec  Memory Limit: 1280 MBSubmit: 1149  Solved: 301[Submit][Status][We ...

  8. CC++中sizeof函数的用法

    C/C++中sizeof()函数的用法 学习C/C++有时会遇到下面的情况: 已知 char *str1="absde"; char str2[]="absde" ...

  9. 未定义的标示符“RECT”,引入了windows.h头文件也没有用?

    我用的是win8的vs2012,RECT应该引入什么头文件?windows.h我第一个就引入了,去windows.h里面搜也搜不到RECT这个关键字,应该引入哪个头文件呢? 真是奇怪啊,是不是还需要什 ...

  10. 重构代码 —— 函数即变量(Replace temp with Query)

    函数即变量,这里的函数指的是返回值为某一对象的函数.Replace temp with query,query 是一种查询函数. example 1 double price() { return t ...