0x00 前言 大部分内容来自参考连接的内容,只是一种爬取内容的思路. 在很久以前自己会有爬取zone-h做目标测试的需求,但是总是有各种反爬限制.而且个别网址还有前端自动生成内容的功能,使用JavaScript可以很方便的让我们得到自己想要得结果做数据整理. 会用到DOM属性如下: document.getElementsByClassName() 返回文档中所有指定类名的元素集合,作为 NodeList 对象. document.getElementById() 返回对拥有指定 id 的第一…
作用:免积分抓取shodan的搜索结果,并把IP保存为txt 前提: ①shodan会员(ps:黑色星期五打折) ②安装有python27 ③谷歌浏览器(ps:版本一定要跟chromedriver匹配) ④windows系统 开始: 一.安装好必要的包 ①win+R 调用cmd ②cd C:\Python27\Scripts(ps:以你自己实际安装目录来) ③pip install selenium ④pip install pyquery 二.下载核心组件和脚本 ①shodan_project…
学习jmeter?从实际出发,我也是一个初学者,会优先考虑先用来做一些简单的抓包.接口测试,在实践的过程中学习jmeter用途.那么接下来,这篇文章我会以jmeter抓包开启我的jmeter旅程. 这里以火狐浏览器.安卓手机为例. 一.浏览器抓包 1.在jmeter中创建线程组,然后新增http代理服务器,配置代理信息. 配置代理信息如下图:Global Settings设置任意未占用的端口号(0000~9999),HTTPS Domains设置代理IP(这里填写jmeter所在机器的IP地址)…
区别于上篇动态网页抓取,这里介绍另一种方法,即使用浏览器渲染引擎.直接用浏览器在显示网页时解析 HTML.应用 CSS 样式并执行 JavaScript 的语句. 这个方法在爬虫过程中会打开一个浏览器加载该网页,自动操作浏览器浏览各个网页,顺便把数据抓下来.用一句简单而通俗的话说,就是使用浏览器渲染方法将爬取动态网页变成爬取静态网页. 我们可以用 Python 的 Selenium 库模拟浏览器完成抓取.Selenium 是一个用于Web 应用程序测试的工具.Selenium 测试直接运行在浏览…
一:抓取简单的页面: 用Python来做爬虫抓取网站这个功能很强大,今天试着抓取了一下百度的首页,很成功,来看一下步骤吧 首先需要准备工具: 1.python:自己比较喜欢用新的东西,所以用的是Python3.6,python下载地址:https://www.python.org/ 2.开发工具:用Python的编译器即可(小巧),不过自己由于之前一直做得前端,使用的webstrom,所以选择JetBrains 公司的PyCharm,下载地址:https://www.jetbrains.com/…
本篇将开始介绍Python原理,更多内容请参考:Python学习指南 为什么要做爬虫 著名的革命家.思想家.政治家.战略家.社会改革的主要领导人物马云曾经在2015年提到由IT转到DT,何谓DT,DT即数据技术,由数据在推倒人们的衣食住行,当今时代是一个大数据时代,数据从何而来? 企业产生的用户数据:百度指数.阿里指数.TBI腾讯浏览指数.新浪微博指数 数据平台购买数据:数据堂.国云数据市场.贵阳大数据交易所 政府机构公开的数据:中华人民共和国国家统计局数据.世界银行公开数据.联合国数据.纳斯达…
自己安全测试技能很低, 上级给的安全测试的任务给了自动化组的同事来做, 自己之前使用appscan的时候 只知道使用appscan的内置浏览器测试抓取请求 今天与自动化美女同事沟通发现有一个代理的功能.发现自己真实孤陋寡闻... 在这里记录一下,备忘.. 打开appscan 1. 文件->新建扫描 新建常规扫描 下一步选择可以录制手机 也可以入职其他机器 想被录制的机器修改代理信息 使用浏览器进行操作或者是客户端进行操作就可以录制了 停止跟踪进行扫描即可…
chrome很强大,很强大,很强大. 想要了解他的强大呢,就先要掌握一些基本的chrome命令. 1. chrome://flags   可用来启用或者关闭某些chrome的体验特性   2. chrome://dns   该命令将显示浏览器预抓取的主机名列表   3. chrome://downloads   该命令同时也可以从菜单中的下载来访问,其快捷键是Ctrl + J  4. chrome://extensions   该命令等同于菜单  -  工具 -  扩展   5. chrome:…
越来越多的网站,开始采用"单页面结构"(Single-page application). 整个网站只有一张网页,采用 Ajax 技术,根据用户的输入,加载不同的内容. 这种做法的好处是用户体验好.节省流量,缺点是 AJAX 内容无法被搜索引擎抓取.举例来说,你有一个网站. http://example.com 用户通过井号结构的 URL,看到不同的内容. http://example.com#1 http://example.com#2 http://example.com#3 但是…
越来越多的网站,开始采用"单页面结构"(Single-page application). 整个网站只有一张网页,采用Ajax技术,根据用户的输入,加载不同的内容. 这种做法的好处是用户体验好.节省流量,缺点是AJAX内容无法被搜索引擎抓取.举例来说,你有一个网站. http://example.com 用户通过井号结构的URL,看到不同的内容. http://example.com#1 http://example.com#2 http://example.com#3 但是,搜索引擎…