背景: 模拟浏览器访问web,发送https请求url,为了实验需求需要获取ipv4数据包 由于不做后续的内容整理(有内部平台分析),故只要写几行代码请求发送https请求url列表中的url即可 开始使用python的urllib库的urllib.request.openurl()来进行访问,例如访问百度的: page = urllib.request.urlopen('https://www.baidu.com') 如果请求成功则执行后续任务,失败则采用异常捕获,跳过此url并记录到文件(在…
之前关于OBB的内容: Android上使用native IO 最近工作中的问题笔记 工作记录[续] android OBB 自从用了Java来mount OBB, 再也没有遇到挂载的问题. 但最近在LG Nexus5 和LG G2上测试, 发现某个大约30K文件的文件, 一次性读取出来以后, 处理会报错. 最后排除各种因素, 比如为了排除buffer坏掉的因素,读的时候单独new一个新buffer,一次性读取,然后dump到sd卡.对比dump出的文件, 发现整个文件中间有n个字节(大约是32…
 前言 Apache Jmeter是开源.易用的性能测试工具,之前工作中用过几次对http请求进行性能测试,对jmeter的基本操作有一些了解.最近接到开发的对java请求进行性能测试的需求,所以需要写java请求的脚本. Java请求的性能测试与http请求的性能测试类似,都是给远程应用提供的服务发送请求并施压,得到响应结果及性能数据.不同的是,http调用的是应用提供的http协议的服务,而java请求调用的是应用提供的接口服务,且需要通过编写代码来实现java请求的调用. 本次压测的jav…
Java获取URL对应的资源   认识IP.认识URL是进行网络编程的第一步.java.net.URL提供了丰富的URL构建方式,并可以通过java.net.URL来获取资源.   一.认识URL   类 URL 代表一个统一资源定位符,它是指向互联网“资源”的指针.资源可以是简单的文件或目录,也可以是对更为复杂的对象的引用,例如对数据库或搜索引擎的查询.   简单的可以把URL理解为包含:协议.主机名.端口.路径.查询字符串和参数等对象.每一段可以独立设置.   应用程序也可以指定一个“相对…
基于http协议,最常用的是GET和POST两种方法. 接口文档需要包含哪些信息: 接口名称接口功能接口地址支持格式 json/xml请求方式请求示例请求参数(是否必填.数据类型.传递参数格式)返回参数说明以典型的(一两个)参数做为判断是否请求通过(重点是看响应的信息判断) 一.GET import requests import json url = "http://v.juhe.cn/laohuangli/d" para = {"key":"eeeee…
一.反向代理是什么 有一篇文章说的挺好的 Nginx 反向代理.负载均衡.页面缓存.URL重写及读写分离详解 http://www.server110.com/nginx/201402/5534.html 简单说一下,正向代理与反向代理 (1).正向代理的概念        正向代理,也就是传说中的代理,他的工作原理就像一个跳板,简单的说,我是一个用户,我访问不了某网站,但是我能访问一个代理服务器,这个代理服务器呢,他能访问那个我不能访问的网站,于是我先连上代理服务器,告诉他我需要那个无法访问网…
一.需求背景 网站刷票时,经常会遇到限制一个ip只能投票一次的限制,为此需要使用代理ip 二.脚本如下: 1.Proxy_http.py使用代理ip发送httpr的get和post请求 #coding:utf-8 import urllib2,urllib,time,socket,random,Proxy_ip,Useragent def Visitpage(proxyip,url): socket.setdefaulttimeout(6) proxy_support = urllib2.Pro…
HTTP URL 格式: http://host[:port][abs_path] 其中http表示要通过HTTP协议来定位网络资源. host表示合法的Internet主机域名或IP地址(以点分十进制格式表示): port用于指定一个端口号,拥有被请求资源的服务器主机监听该端口的TCP连接. 如果port是空,则使用缺省的端口80.当服务器的端口不是80的时候,需要显式指定端口号. abs_path指定请求资源的URI(Uniform Resource Identifier,统一资源定位符),…
python requests库发送请求时,比如get请求,大概过程. 一.发起get请求过程:调用requests.get(url,**kwargs)-->request('get', url, **kwargs)-->session.request(method="get", url=url, **kwargs)-->session.send(request, **kwargs)-->adapter.send(request, **kwargs)-->…
在写爬虫的时候,难免会遇到报错,比如 4XX ,5XX,有些可能是网络的原因,或者一些其他的原因,这个时候我们希望程序去做第二次下载, 有一种很low的解决方案,比如是用  try  except try: ------- except: try: -------- except: try: ------ except: try: ------ except: try: ------ except: try: ------ except: ------ 有没有看起来更舒服的写法呢? 我们可以用递…