基于python的自动化代码审计

代码审计逢魔安全实验室

2018-02-11 10,539

本文通过介绍在python开发中经常出现的常规web漏洞，然后通过静态和动态两种方式对python代码进行自动化审计挖掘漏洞，并且展示自动化系统在自动化审计python应用代码的成果，本文比较长，请耐心阅读，惊喜在后面。

从python常规漏洞来看都有一个共同点，那就是危险函数中使用了可控参数，

如system函数中使用到的(‘mv %s’% filename)，
如execute函数中使用到的username参数,
如HttpResponse中使用到的nickname参数，

这些参数直接从第一层入口函数中传进来，或者经过简单的编码，截断等处理直接进入危险函数，导致了以上危险行为。

静态分析的核心是什么？

注入判断的核心就在于找到危险函数，并且判断其参数是可控的，找到危险函数这个只需要维护一个危险函数列表即可。

当在语法树中发现了函数调用并且其名称在危险列表中就可以标记出该行代码，接下来的难点就在于跟踪该函数的参数，默认认为该危险函数的外层函数的参数是可控的，那就只需要分析这个外层函数参数的传递过程即可

在python中，参数的处理过程大概总结如下这些情况：

直接赋值：GET参数直接赋值

属性赋值：request.POST.get(‘name’)赋值，排除META中的内容

字符串拼接：字符串拼接

列表解析式：

元组、列表、字典数据处理：元素相加，赋值value等

Subscript分片取值：通过下标索引取值

函数调用后赋值：字符串操作的系统函数str，strip，split，encode等，未过滤的自定义函数，危险函数

With操作：

For循环：

If判断：

排除特殊情况：

判断是否合法：os.path.exitst，isdir等

锁定范围：Type in [xxx,xxx]

如果存在此文件中导入了其他非系统模块，继续递归解析此模块文件

如果存在类的话，继续递归类里面方法的内容

Body的内容是嵌套的，一个body里面可能还有很多个body

循环body体中的元素，然后取出body中的body，orelse，test，handlers元素，继续递归查找可控参数

以行为单位解析出来的结构和内容

Name为被赋值的变量名

然后value里面就是具体的内容

从右往左一次嵌套，所以request在最里层的value

以Python文件为入口，解析成语法树，格式化为json格式

取出语法树中的函数体内容

然后遍历函数体中的代码行：

如果有危险函数调用，并且有可控参数进入此危险函数，则报出漏洞

所以这里的核心就是：

1、递归全部代码查找可控参数，生成可控参数列表

2、维护危险函数列表

最早的版本已经开源，大家可以借鉴，可以阅读代码了解python的语法树

静态分析的缺陷：

漏报误报高

可控参数分析覆盖不够全

外部导入函数对可控参数判断的影响

python 是一种动态类型语言，python 中一切皆对象

所以换句话说每个对象可以在程序里任何地方改变它

这就意味着我们可以劫持我们认为危险的函数

拦截进入函数的参数，判断是否有恶意参数进入，从而判断是否存在漏洞

Python的广泛使用，很大部分是因为开发效率高，模块使用方便

所以就劫持就针对：

1、模块的直接方法

2、模块的类，已经类方法进行了

举例：

模块的方法可以直接被劫持

首先通过imp导入os模块，然后在覆盖到其中的system方法

在调用system方法时，就是这里的__call__方法了

判断进入system方法的参数是否有恶意内容，从而可以判断是否真正触发了漏洞

元类：

元类就是用来创建类的类，函数type实际上是一个元类

元类的主要目的就是为了当创建类时能够自动地改变类。

__metaclass__：

你可以在写一个类的时候为其添加__metaclass__属性, Python就会用它来创建类

__metaclass__可以接受任何可调用的对象，你可以在__metaclass__中放置可以创建一个类的东西

__new__:是用来创建类并返回这个类的实例

__call__:任何类，只需要定义一个__call__()方法，就可以直接对实例进行调用,用callable来判断是否可被调用

__getattribute__:定义了你的属性被访问时的行为

你首先写下class Foo(object)，但是类对象Foo还没有在内存中创建。

Python会在类的定义中寻找__metaclass__属性，如果找到了，Python就会用它来创建类Foo，如果没有找到，就会用内建的type来创建这个类

定义test类，使用metaclass来创建tesk类

这时在metaclass中就可以动态修改这个类

这里使用upperattr，在创建test类时，将属性名称全部大写

在test类实例化的时候就会执行上述操作，达到动态修改类的效果

举例：

模块的类的劫持

在当前pythonpath路径下创建socket.py文件

然后劫持_fileobject类，使用_installclshook动态修改此类

变量_fileobject的属性方法时，返回_hook_writelin 和 _hook_readline

写好的劫持脚本，放到当前的工作根目录下即可

然后正常启动项目，劫持脚本就会自动生效，劫持特定的方法

但是内建函数方法，built-in method无法直接覆盖劫持

这时也可以通过monkey path来实现：

Monkey patch就是在运行时修改代码，实现hot patch的一种手段

将patch脚本import到应用里面，在功能函数入口通过装饰器的方式应用patch即可

动态审计的优点：

准确性高
可以平台化
但是使用和扩展需要了解具体模块的结构，pyhton的魔术方法等基础知识
因为需要部署到目标系统代码中，所以动态修改后的类和方法会对系统造成未知的影响，（不过目前测试来看还没出现）

这里这个开源的项目是使用动态hook来制作python后门的例子，可以参考

动态检测和静态检测相结合，相辅相成，相互补助，才能达到更好的效果，最后才能自动化检测

对于，git和svn这种版本控制的，可以不用每次都扫描全部代码，可以根据版本号扫描范围之间的代码，节省资源，速度快

下载agent安装包后，根据右边的部署说明，部署agent到需要检测的服务器上即可

成功部署agent后，会在平台上显示主机是否在线

并且agent会自动hook功能代码入口：

比如django开发的系统，根据url整理views中的方法，然后自动劫持这些方法即可，不用全部劫持，尽量减少对系统代码的改动

用户设置代理，正常访问系统

代理替换参数内容为payload，到系统后，漏洞检测系统自动检测漏洞然后显示信息到控制台

欢迎阅读，关于此自动化审计系统开源情况请关注FormSec官方公众号，谢谢！

本文作者：逢魔安全实验室

本文为安全脉搏专栏作者发布，转载请注明：https://www.secpulse.com/archives/68344.html

Tags: csrf、Python、Sql注入、SSRF、SSTI、web漏洞、XSS、代码审计、动态分析、危险函数、可控参数、命令执行、基于python的自动化代码审计、注入防御、自动化、自动化应用、静态分析

python 自动化审计的更多相关文章

flow.ci + Github + Slack 一步步搭建 Python 自动化持续集成
理想的程序员必须懒惰,永远追随自动化法则.Automating shapes smarter future. 在一个 Python 项目的开发过程中可能会做的事情:编译.手动或自动化测试.部署环境配置 ...
Selenium2+python自动化23-富文本（自动发帖）
前言富文本编辑框是做web自动化最常见的场景,有很多小伙伴遇到了不知道无从下手,本篇以博客园的编辑器为例,解决如何定位富文本,输入文本内容一.加载配置 1.打开博客园写随笔,首先需要登录,这里为了 ...
Selenium2+python自动化24-js处理富文本（带iframe）
前言上一篇Selenium2+python自动化23-富文本(自动发帖)解决了富文本上iframe问题,其实没什么特别之处,主要是iframe的切换,本篇讲解通过js的方法处理富文本上iframe的 ...
Selenium2+python自动化7-xpath定位
前言在上一篇简单的介绍了用工具查看目标元素的xpath地址,工具查看比较死板,不够灵活,有时候直接复制粘贴会定位不到.这个时候就需要自己手动的去写xpath了,这一篇详细讲解xpath的一些语法. ...
Selenium2+python自动化13-Alert
不是所有的弹出框都叫alert,在使用alert方法前,先要识别出它到底是不是alert.先认清楚alert长什么样子,下次碰到了,就可以用对应方法解决.alert\confirm\prompt弹出框 ...
【python自动化第十一篇】
[python自动化第十一篇:] 课程简介 gevent协程 select/poll/epoll/异步IO/事件驱动 RabbitMQ队列上节课回顾进程: 进程的诞生时为了处理多任务,资源的隔离, ...
Day1 老男孩python自动化运维课程学习笔记
2017年1月7日老男孩python自动化运维课程正式开课第一天学习内容: 上午 1.python语言的基本介绍 python语言是一门解释型的语言,与1989年的圣诞节期间,吉多·范罗苏姆为了在阿 ...
Selenium2+python自动化28-table定位
前言在web页面中经常会遇到table表格,特别是后台操作页面比较常见.本篇详细讲解table表格如何定位. 一.认识table 1.首先看下table长什么样,如下图,这种网状表格的都是table ...
python自动化运维学习第一天--day1
学习python自动化运维第一天自己总结的作业所使用到知识:json模块,用于数据转化sys.exit 用于中断循环退出程序字符串格式化.format字典.文件打开读写with open(file, ...

随机推荐

Latency 和 Delay 区别
时延:Latency 指的是一个报文进入一台设备以致这台设备所经历的时间.实际上考验的是报文在这台设备上消耗的时间.时间越短,这台设备的性能越高. 延时:Delay 是指一个操作和另个一个操作之间 ...
TKE 容器网络中的 ARP Overflow 问题探究及其解决之道
作者朱瑜坚,腾讯云后台开发工程师,熟悉 CNI 容器网络相关技术,负责腾讯云 TKE 的容器网络的构建和相关网络组件的开发维护工作,作为主力开发实现了 TKE 下一代容器网络方案. 1. 问题背景 1 ...
AOP(面向切面编程)大概了解一下
前言上一篇在聊MemoryCache的时候,用到了Autofac提供的拦截器进行面向切面编程,很明显能体会到其优势,既然涉及到了,那就趁热打铁,一起来探探面向切面编程. 正文 1. 概述在软件业, ...
敏捷史话（九）：用做面包的方式做敏捷——Alistair Cockburn
在一次用例和敏捷技术交流大会上,Alistair给大家分享了自己比较崇尚的三个字: "守""破""离",他用做面包的例子,形象地将这三个字与 ...
GTID介绍
从MySQL5.6开始增加GTID这个特性,Global Transaction ID,全局事务ID,用来强化主从数据库的一致性,故障恢复,以及容错能力,来替代传统的人工的主从复制: 有了GTID,在 ...
Windows系统和Linux系统下安装Mongodb及可视化页面展示
一.Windows系统安装MongoDB 下载地址: 官方:http://www.mongodb.org/ 其它:http://dl.mongodb.org/dl/win32/x86_64 下 ...
P3388 【模板】割点（割顶）题解（Tarjan）
题目链接 P3388 [模板]割点(割顶) 解题思路最近学的东西太杂了,多写点博客免得自己糊里糊涂的过去了. 这个题求割点,感觉这篇文章写得挺好. 割点是啥?如果去掉这个点之后连通图变成多个不连通图 ...
Django之缓存、信号和图片验证码、ORM性能
一. 缓存 1. 介绍缓存通俗来说:就是把数据先保存在某个地方,下次再读取的时候不用再去原位置读取,让访问速度更快. 缓存机制图解 2.Django中提供了6种缓存方式 1. 开发调试 2. 内存 ...
什么是SSR SSR有什么用如何使用使用SSR
什么是SSR 以下信息来自维基百科: Shadowsocks(简称SS)是一种基于Socks5代理方式的加密传输协议,也可以指实现这个协议的各种开发包.当前包使用Python.C.C++.C#.Go语 ...
推荐一款全能测试开发神器：Mockoon！1分钟快速上手！
1. 说一下背景在日常开发或者测试工作中,经常会因为下游服务不可用或者不稳定时,通过工具或者技术手段去模拟一个HTTP Server,或者模拟所需要的接口数据. 这个时候,很多人脑海里,都会想到可以 ...

python 自动化审计

基于python的自动化代码审计

python 自动化审计的更多相关文章

随机推荐

热门专题