Web应用系统的小安全漏洞及相应的攻击方式

接口自动化测试的"开胃小菜"

1 写作目的

本文讲述一个简单的利用WebAPI来进行一次基本没有破坏力的“黑客”行为。

主要目的如下：

了解什么叫安全漏洞
知道什么是api
了解一些获取api的工具
通过对API的认识了解白盒接口测试基本概念和技术

免责声明：

本文主要是以学习交流为目的，而且实验的对象也是通过搜索引擎随机选择的。不以搞破坏为目的，纯粹是以教学为目的，同时也警醒大伙重视基本的互联网安全。当然，本文会对关键字打个马赛克，防止有兴趣的同学也把网站主当了靶子了。

如果网站主通过搜索引擎找到了本文，希望网站主最先能够做的是如何使用简单的方法堵住漏洞，当然如果网站主要求本文删除相应的信息，本文也会全力配合的。

2 背景介绍

先说一个在互联网上常见，但是普通人又不太理解的东西--“验证码”。

下面是来自 百度百科 的一段解释：

验证码（CAPTCHA）是“Completely Automated Public Turing test to tell Computers and Humans Apart”（全自动区分计算机和人类的图灵测试）的缩写，是一种区分用户是计算机还是人的公共全自动程序。可以防止：恶意破解密码、刷票、论坛灌水，有效防止某个黑客对某一个特定注册用户用特定程序暴力破解方式进行不断的登陆尝试，实际上用验证码是现在很多网站通行的方式，我们利用比较简易的方式实现了这个功能。这个问题可以由计算机生成并评判，但是必须只有人类才能解答。由于计算机无法解答CAPTCHA的问题，所以回答出问题的用户就可以被认为是人类。

一般对于开放式的互联网应用，在有需要“上行”数据接口的地方都需要加上一道验证码（也可以是验证短信，但是考虑到成本问题，验证码还是更普遍一些），以防止机器程序使用其远高于人的计算能力进行一些恶意破坏行为。

所谓的恶意行为从技术本质上讲就是利用web应用已经提供的一些接口，来对网站主的后台数据库进行 增/删/改/查 的操作，而且由于这种操作是由计算机来完成，计算机巨大的计算能力常常伴产生极恐怖的破坏力。

查询数据
- 耗尽网络式攻击。攻击者网络带宽资源超级丰富的，可以OS占满被攻击对象的入口和出口带宽，无法对外正常提供服务。
- 耗尽服务器负载攻击。大量高并发的数据库请求，超过数据库的最大连接数，导致web应用无法完成数据库的正常查询。
- 耗尽服务器CPU攻击。对于有复杂计算的应用，每次调用一次服务会造成大量的CPU消耗，导致服务异常。
- 耗尽服务器内存攻击。通过查询产生大量的session，耗尽服务器内存。
增加数据

在web应用里面恶意注册几十万级别的僵尸用户。然后通过程序来操控这些用户来投票，转发，刷帖等等。比如，微博，广告行业
删除/修改数据

造成数据的不正常，这样的后果也是不可估量的。比如金融行业，比如电子交易行业。

通过“图灵测试”可以达到对自然人和机器的良好区分，以达到将机器程序抵挡在外面的目的，阻止其利用其强大的计算能力和自动化信息处理能力来实施破坏。这就是“验证码”的最基本作用。

那么回归到今天的正题，既然是“黑客技术入门”和“接口自动化测试”的入门篇，本文就先挑一些难度低的开始，专门找“软柿子”来捏一下。

3 主要工具

Google搜索引擎

搜索资料和寻找“猎物”
Chrome

查看web应用提供的接口的最简单的方式
Wireshark

一种高级的查找接口的工具，可在某些不适合Chrome的场合进行使用
Python

编码破解代码的脚本

4 寻找攻击对象

通过搜索引擎，找关键字：“意见反馈”、“用户反馈”，得到如下的搜索结果：

“用户反馈”模块有如下特点：

有数据上行。因为有向服务器提交数据，会通过相应的接口往网站主服务器上写相应的数据。
在Web应用里面重要性很低。很多是象征的摆设，所以安全防范极低。
不涉及具体的重要业务。可以在练手的同时，也不会产生多少破坏。

只需要找出里面没有验证码的页面就可以了，主要的搜索结果如下：

有验证码的网站：

360好搜
凤凰网
56.com

无验证码的网站：

新浪微博
搜狗网址导航
百度音乐
百度百科
网易163
有道词典
易车
114la
中科大教务处

这只是Google的前两页的搜索结果，发现已经有一大半在这一块是没有进行任何防守的。既然已经找到了这么一个简单的安全“漏洞”，下面就开始实施无关痛痒的“攻击”行为。

由于本文主要是出于学习和交流目的，为了保护实验对象的一些隐私，所以下面的图片和相应的URL都会进行一些简单的马塞克。

5 收集api信息

由于Web应用系统本身是不对外开放api的，但是互联网公司的产品为了追求高扩展性和前后端完全分离独立，通常使用如下技术架构：

互联网应用的架构，客户端和服务器一般都是基于Http API来进行通讯，所以对于B/S的程序来说，可以很容易通过一些辅助工具来找到通讯的接口。

某个网站“有幸”被选中了：

http://x.xxx.xx/ugc/out/feedback/

使用Chrome浏览器打开页面

然后填写好表单之后，点击提交按钮。当然，因为提交按钮之后，会跳转到另外一个页面，不便于我们查看提交的数据值，所以要做一些简单的修改，就是表单提交的服务器API简单修改成一个不存在的即可：

然后在Chrome的Network里面可以看到接口信息：

然后将右侧的接口详细数据信息展开，就可以查看到表单值：

这个表单就告诉了我们此网站应用的服务器端API所接收的合法的数据的格式，这样就相当于知道了调用的方式了。

知道了接口，知道了调用方式，那么接下来就可以通过写程序来实施“黑客”行为了。

6 编写crack脚本

由于本人python比较熟悉，所以就使用python来进行相应的操作演示。

def test_crack_feedback(self):

    """

    反馈页面刷的测试

    :return:

    """

    url_para = {

        'proType': 5,

        'platType': 1,

        'referer': 'https://www.google.com/',

        'content': '看你们是否存在此漏洞',

        'tel': '123144',

        'email': 'adsf@11',

        'qq': '123544',

        'location': '北京市',

        'ip-location': '北京市',

        'ip-service': '联通',

    }

    post_url = 'http://x.xxx.xx/ugc/out/feedback/?act=add'

    res = requests.post(post_url, data=url_para)

    glog.debug(res.text)

返回值

[2015-05-27 10:58:51,166] connectionpool.py:_new_conn-(259)INFO: Starting new HTTP connection (1): x.xxx.xx

[2015-05-27 10:58:51,764] connectionpool.py:_make_request-(390)DEBUG: Setting read timeout to None

[2015-05-27 10:58:52,175] connectionpool.py:_make_request-(430)DEBUG: "POST /ugc/out/feedback/?act=add HTTP/1.1" 200 None

[2015-05-27 10:58:52,245] singlefun.py:run_xxx-(29)DEBUG: {"retcode":200,"message":null}

根据200的状态码，明显是成功了。因为有经验的Web开发人员都清楚，Http的200状态码就表示成功调用的返回值了。

如果我使用个for循环，将此程序运行100万次，那么这个网站主的这个地方的数据库估计就要抓狂了。如果使用多个机器连续疯狂的刷，而且恰好这个数据表和他们的核心业务数据库放在一起，那么这将会导致数据库连接数量超过极限，导致正常的服务无法被提供了。

7 后续展望和总结

本文只是演示了如何利用Chrome去寻找Web应用的接口及调用。而对于看不到前端代码的App应用，则可以通过抓包工具Wireshark来轻松获得相应的接口及调用。

网站主避免此漏洞的方法：给相应的位置加上可靠的“验证码”即可。 PS：传统的字符型验证码，稍微会一些图片识别技术，或者机器学习技术，也是相当好破解的。目前的OCR技术已经相当发达了，想想注册Gmail的时候，那一串人都不认识的字符，结果程序可以进行90%的成功破解率，可想而之机器远比人类想像得要厉害。

当然，如何做好“图灵测试”对“自然人”和“机器人”进行区分，已经成为安全领域的一个重要的课题，也非本文重点讨论的问题了，有兴趣的同学可以在相关领域继续研究吧。

这个事情给做Web应用系统的人员两个警钟：

所有涉及到数据交互的地方，最好加上验证码。
数据尽量要按照重要等级分开部署。

8 免责声明

本文只是以学习交流为目的
本文没有产生破坏行为
本文所获取的信息都是通过正常的暴露在外部的信息得到的
本文隐藏了具体的URL目标的信息
如果实在是有人有要求认为本文造成了事实伤害，作者会按照要求删除此文
最后希望此文能够给有志做接口自动化测试的朋友提供了一个好的“开胃菜”

作者:	Harmo哈莫
作者介绍:	https://zhengwh.github.io
QQ:	1295351490
时间:	2015-08-24
版权说明:	未经许可，严禁用于商业目的的非法传播
联系或打赏:	http://zhengwh.github.io/contact-donate.html

接口自动化测试的"开胃小菜"---简单黑客攻击手段的更多相关文章

如何简单实现接口自动化测试（基于 python）原博主地址https://blog.csdn.net/gitchat/article/details/77849725
如何简单实现接口自动化测试(基于 python) 2017年09月05日 11:52:25 阅读数:9904 GitChat 作者:饿了么技术社区原文:如何简单实现接口自动化测试(基于 python ...
简单实现接口自动化测试(基于python+unittest)
简单实现接口自动化测试(基于python+unittest) 简介本文通过从Postman获取基本的接口测试Code简单的接口测试入手,一步步调整优化接口调用,以及增加基本的结果判断,讲解Pytho ...
使用 JsonPath 完成接口自动化测试中参数关联和数据验证（Python语言）
背景: 接口自动化测试实现简单.成本较低.收益较高,越来越受到企业重视 restful风格的api设计大行其道 json成为主流的轻量级数据交换格式痛点: 接口关联也称为关联参数.在应用业务接口中 ...
记录python接口自动化测试--简单总结一下学习过程(第十目)
至此,从excel文件中循环读取接口到把测试结果写进excel,一个简易的接口自动化测试框架就完成了.大概花了1周的时间,利用下班和周末的时间来理顺思路.编写调试代码,当然现在也还有很多不足,例如没有 ...
seldom 2.0 让接口自动化测试更简单
前言 HTTP接口测试很简单,不管工具.框架.还是平台,只要很的好的几个点就是好工具. 测试数据问题:比如删除接口,重复执行还能保持结果一致,必定要做数据初始化. 接口依赖问题:B接口依赖A的返回值, ...
Django 接口自动化测试平台
本项目工程 github 地址:https://github.com/juno3550/InterfaceAutoTestPlatform 0. 引言 1. 登录功能 2. 项目 3. 模块 4. 测 ...
Avast!：小型网站最易遭受的3种黑客攻击
avast是捷克研发的杀毒软件,从网站上找到一篇avast关于网站安全的文章,觉得颇有意思,因此想到翻译过来与大家共享.有不对之处还望大家批评指正. 一个拥有上万访问者的小型网站管理员发来一份信,向我 ...
(转)接口自动化测试 – Java+TestNG 测试 Restful Web Service
本文主要介绍如何用Java针对Restful web service 做接口自动化测试(数据驱动),相比UI自动化,接口自动化稳定性可靠性高,实施难易程度低,做自动化性价比高.所用到的工具或类库有 T ...
零成本实现接口自动化测试 – Java+TestNG 测试Restful service
接口自动化测试 – Java+TestNG 测试 Restful Web Service 关键词:基于Rest的Web服务,接口自动化测试,数据驱动测试,测试Restful Web Service, ...

随机推荐

swift 手机号码正则表达式记录一下
func isTelNumber(num:NSString)->Bool { var mobile = "^1(3[0-9]|5[0-35-9]|8[025-9])\\d{8}$&qu ...
Beginning Scala study note(6) Scala Collections
Scala's object-oriented collections support mutable and immutable type hierarchies. Also support fun ...
linux中redis的主从
主从模式的概念请自行百度! 主服务器只执行写操作.从服务器执行读操作. 主服务器中的数据会同步到从服务器中. 在从服务器中打开redis目录中的redis.conf文件 vim /usr/local/ ...
SQL 数字分割的字符串
:表示包含正数或者负数.或者0 即表示,数字的字段! select * from 表名 where isnull(字段名,'')<>'' 同时排除空值和null的情况 select coo ...
LINUX 查看当前系统的内存使用情况
# free 显示结果如下: Mem:表示物理内存统计 total 内存总数 8057964KB used 已使用的内存 7852484KB free 空闲的内存数 205480KB shared 当 ...
log4j:WARN Please initialize the log4j system properly 问题解决
log4j:WARN No appenders could be found for logger (com.netease.qa.testng.TestngRetry).log4j:WARN Ple ...
2016 ACM/ICPC Asia Regional Dalian Online 1010 Weak Pair dfs序+分块
Time Limit: 4000/2000 MS (Java/Others) Memory Limit: 262144/262144 K (Java/Others)Total Submissio ...
Redis为什么使用单进程单线程方式也这么快
[转] http://www.syyong.com/db/Redis-why-the-use-of-single-process-and-single-threaded-way-so-fast.htm ...
PB12.5.2安装
一.从12.5升级到12.5.2_build5550安装步骤: 1.安装VS2010及SP1 2.安装12.50(可以只装PB)DV68538-65-1250-01.zip 3.安装EBF20963 ...
CompiledEffect Direct3D9 Sample fxc.exe

接口自动化测试的"开胃小菜"---简单黑客攻击手段