python 3 关于requests库的 text / content /json

最近在爬SDFDA的数据，刚开始用urllib.request 库，一直连不到数据；

后来通过CHROME浏览器的F12，发现该网站用的是JSON格式{}'Content-Type': 'application/json',}，不同于以往的提交方式“Content-Type: text/html; charset=utf-8"

试了各种方法，一直不能取得数据。

看的许多介绍方法中有用“requests”库的，一试果然简单方便，可以直接发送JSON格式的数据参数；下载安装后，导入“import resquest”

很快以往的问题得到解决，能将想要页面内容读取出来，但显示的是\u9882十六进制的编码，没有办法继续“百度”，

发现了requests库中的，content 属性和JSON属性，一试果然见效；

查了下资料：

resp.text返回的是Unicode型的数据。
resp.content返回的是bytes型的数据。
也就是说，如果你想取文本，可以通过r.text。
如果想取图片，文件，则可以通过r.content。
（resp.json()返回的是json格式数据）

#-*- coding:utf-8 -*-

#读取山东FDA的药品GSP认证经营企业数据

# 20161128 zhangshaohua

import re

import requests

import json

#读取首页

url = 'http://124.128.39.251:9080/sdfdaout/jsp/datasearch/searchinfolist.jsp?pageSize=10&entType=drugGSP&thisPage=1'

url = 'http://124.128.39.251:9080/sdfdaout/jsp/datasearch/searchinfolist.jsp?pageSize=10&thisPage=2&entType=drugGSP'

#url = 'http://124.128.39.251:9080/sdfdaout/jsp/datasearch/searchinfolist.jsp?pageSize=10&thisPage=12&entType=drugGSP'

#取总记录数,每页20条#zjls = getContent(url,'共(\d{1,5})页','UTF-8')

headers = {

'Host': '124.128.39.251:9080',

'Proxy-Connection': 'keep-alive',

'Content-Length': '256',

'Origin': 'http://124.128.39.251:9080',

'X-Requested-With': 'XMLHttpRequest',

'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36',

'Content-Type': 'application/json',

'Accept': '*/*',

'Referer': 'http://124.128.39.251:9080/sdfdaout/jsp/datasearch/searchinfolist.jsp',

'Accept-Encoding': 'gzip, deflate',

'Accept-Language': 'zh-CN,zh;q=0.8',

}

url = 'http://124.128.39.251:9080/sdfdaout/command/ajax/com.lc.datasearch.cmd.SearchInfoQueryCmd'

parms = {"params":{"javaClass":"org.loushang.next.data.ParameterSet","map":{"limit":10,"start":10,"entType":"drugGSP","defaultSort":{"javaClass":"ArrayList","list":[]},"dir":"ASC","needTotal":True},"length":7},"context":{"javaClass":"HashMap","map":{},"length":0}}

values = json.dumps(parms)

req = requests.post(url,data=values,headers=headers)

content = req.json()

print(content)

print(type(content))

print('药品零售企业读取完成！')

　　学习路上的坑还没有完。

一直在PYTHON 客户端中试的好好的，一到CMD执行程序就变成了以上的提示；认真对比了两边的代发现：

content = req.json 和

content = req.json()

带（）返回的是JSON的数据，req.json 只返回类型为method 的一个提示；

python 3 关于requests库的 text / content /json的更多相关文章

python下载安装requests库
一.python下载安装requests库 1.到git下载源码zip源码https://github.com/requests/requests 2.解压到python目录下: 3.“win+R”进 ...
Python爬虫之requests库介绍(一)
一:Requests: 让 HTTP 服务人类虽然Python的标准库中 urllib2 模块已经包含了平常我们使用的大多数功能,但是它的 API 使用起来让人感觉不太好,而 Requests 自称 ...
Python语言之requests库
发送请求.传递URL参数.定制headers.接受数据,处理数据等在Java中用httpclient jar包,在Python中用requests库,即使没有事先下载,在Pycharm开发工具中,出 ...
Python爬虫：requests 库详解，cookie操作与实战
原文第三方库 requests是基于urllib编写的.比urllib库强大,非常适合爬虫的编写. 安装: pip install requests 简单的爬百度首页的例子: response.te ...
Python爬虫之requests库的使用
requests库虽然Python的标准库中 urllib模块已经包含了平常我们使用的大多数功能,但是它的 API 使用起来让人感觉不太好,而 Requests宣传是 "HTTP for ...
【Python爬虫】Requests库的基本使用
Requests库的基本使用阅读目录基本的GET请求带参数的GET请求解析Json 获取二进制数据添加headers 基本的POST请求 response属性文件上传获取cookie 会 ...
python爬虫之requests库
在python爬虫中,要想获取url的原网页,就要用到众所周知的强大好用的requests库,在2018年python文档年度总结中,requests库使用率排行第一,接下来就开始简单的使用reque ...
python接口自动化测试 - requests库的基础使用
简单介绍 requests库简单易用的HTTP库 Get请求格式: requests.get(url) 注意:若需要传请求参数,可直接在 url 最后的 ? 后面,也可以调用 get() 时多加一个 ...
python爬虫(1)requests库
在pycharm中安装requests库的一种方法首先找到设置搜索然后安装,蓝色代表已经安装 requests库中的get请求与HTTP协议相对应,requests库也有七种请求方式. 获取ur ...

随机推荐

【Hadoop】HADOOP 总结--思维导图
wp8手机浏览器项目
项目需求如下: 1.页面布局最上方为搜索/网址框中间为网页显示区,默认主页为百度搜索最下方为功能栏,分别有后退,前进,窗口和更多功能在更多功能中有分享给好友发送网址到桌面查看历史记录等 ...
input 中 datetime-local 方法
<input type=" datetime-local "> 这个标签是H5新增的对象方法能把现有的时间赋值给它但是注意:必须是 yyyy-MM-ddTHH: ...
2017.4.18 静态代码分析工具sonarqube+sonar-runner的安装配置及使用
配置成功后的代码分析页面: 可以看到对复杂度.语法使用.重复度等等都做了分析,具体到了每一个方法和每一句代码. 四种使用方式: sonarqube + sonar-runner sonarqube + ...
2017.4.7 java异常处理总结
目录 1.java异常处理的几种错误做法 2.异常处理示例 3.常用异常 4.异常类的继承关系 5.异常处理机制 6.Throw和Throws的区别 7.e.toString(), e.getCaus ...
Angular 学习笔记——$interpolate
<!DOCTYPE HTML> <html ng-app="myApp"> <head> <meta http-equiv="C ...
gitlab创建项目代码：
cd (当前工程文件夹目录) git init //初始化git git remote add origin http://worker.njbandou.com/KLElevator/kle ...
第14章5节《MonkeyRunner源代码剖析》 HierarchyViewer实现原理-装备ViewServer-查询ViewServer执行状态
上一小节我们描写叙述了HierarchyViewer是怎样组建ADB协议命令来实现ViewServer的port转发的.在port转发设置好后,下一个要做的事情就是去检測目标设备端ViewServer ...
SQL语句练习手册--第一篇
表架构 Student(S#,Sname,Sage,Ssex) 学生表 Course(C#,Cname,T#) 课程表 SC(S#,C#,score) 成绩表 Teacher(T#,Tname) 教师 ...
自定义HttpReqeust，解决request请求参数只能拿一次就失效的问题
定义一个过滤器并实现如下方法 @Override protected void doFilterInternal(HttpServletRequest request, HttpServletResp ...

python 3 关于requests库的 text / content /json

python 3 关于requests库的 text / content /json的更多相关文章

随机推荐

热门专题