python3 模拟登录网站

最近学习python，因经常登录公积金网站查看公积金缴存还款情况，so网上找了写脚本，修改了一下，方便获取网页中的数据。

使用谷歌浏览器F12查看登录请求内容

1.request header需要参数：User-Agent、Referer等。

2.post内容。

python 3.x中urllib库和urilib2库合并成了urllib库。

urllib2.urlopen()变成了urllib.request.urlopen()

urllib2.Request()变成了urllib.request.Request()

cookielib 模块-》http.cookiejar

#! /usr/bin/env python

# -*- coding:gb2312 -*-

# __author__="zhaowei"

'''

　　 python3.4

    模拟登录郑州公积金网站，查询缴存至月份。

'''

from html.parser import HTMLParser

import urllib

import http.cookiejar

import string

import re

hosturl = 'http://www.zzgjj.com/index.asp'

posturl = 'http://www.zzgjj.com/user/login.asp'

cj = http.cookiejar.CookieJar()

cookie_support = urllib.request.HTTPCookieProcessor(cj)

opener = urllib.request.build_opener(cookie_support, urllib.request.HTTPHandler)

urllib.request.install_opener(opener)

h = urllib.request.urlopen(hosturl)

headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64; rv:38.0) Gecko/20100101 Firefox/38.0',

           'Referer': 'http://www.zzgjj.com/index.asp'}

postData = {'selectlb': '',#登录模式，身份证2，账号1

            'username': '', #公积金账号

            'radename': '赵威',#姓名

            'mm': '',#密码

            'submit322': '确认'#固定值

            }

postData = urllib.parse.urlencode(postData, encoding='gb2312').encode('gb2312')

#因为post里面有中文，因此需要先把url经过gb2312编码处理，然后再把请求编码为gb2312字节码（post必须是字节码）。

request = urllib.request.Request(posturl, postData, headers)

response = urllib.request.urlopen(request)

text = response.read()

html = text.decode('gb2312')

hgjj_last_data = re.findall('<td><p>缴至月份:</p>(\s*)</td>(\s*)<td>(.*?)</td>', html)

#使用正则表达式匹配缴至月份

print(hgjj_last_data[0][2])

 referer：http://www.blogjava.net/hongqiang/archive/2012/08/01/384552.html

python3 模拟登录网站的更多相关文章

Python 3.3.3 使用requests模拟登录网站
在模拟登录上,requests确实比python标准库中的相关模块更加简洁. 假设你需要去爬一组页面(targetUrls),而这些页面要登录才能进行访问.那么requests能够提供一种相当简单的语 ...
[Python] 模拟登录网站（。。为了之后操作数据。。）
我司的内部管理(Web)系统(日报)着实..(mafan).. 所以,就想自己动手增加一下便利性. 计划是, - 桌面程序用来方便记录(按自己格式,数据随时保存到sqlite中,备用) 通过一览来确 ...
Python3 模拟登录知乎（requests）
# -*- coding: utf-8 -*- """ 知乎登录分为两种登录一是手机登录 API : https://www.zhihu.com/login/phone ...
用python代码模拟登录网站
方法一:直接使用已知的cookie访问特点: 简单,但需要先在浏览器登录具体步骤: 1.用浏览器登录,获取浏览器里的cookie字符串先使用浏览器登录.再打开开发者工具,转到network选项卡 ...
Python手动构造Cookie模拟登录后获取网站页面内容
最近有个好友让我帮忙爬取个小说,这个小说是前三十章直接可读,后面章节需要充值VIP可见.所以就需要利用VIP账户登录后,构造Cookie,再用Python的获取每章节的url,得到内容后再使用 PyQ ...
python之cookie, cookiejar 模拟登录绕过验证
0.思路如果懒得模拟登录,或者模拟登录过于复杂(多步交互或复杂验证码)则人工登录后手动复制cookie(或者代码读取浏览器cookie),缺点是容易过期. 如果登录是简单的提交表单,代码第一步模拟登 ...
【Python数据分析】Python模拟登录(一) requests.Session应用
最近由于某些原因,需要用到Python模拟登录网站,但是以前对这块并不了解,而且目标网站的登录方法较为复杂, 所以一下卡在这里了,于是我决定从简单的模拟开始,逐渐深入地研究下这块. 注:本文仅为交流学 ...
【py登陆】python模拟登录
用Python模拟登录网站前面简单提到了 Python 模拟登录的程序,但是没写清楚,这里再补上一个带注释的 Python 模拟登录的示例程序.简单说一下流程:先用cookielib获取cookie ...
转：使用C#的HttpWebRequest模拟登陆网站
这篇文章是有关模拟登录网站方面的. 实现步骤: 启用一个web会话发送模拟数据请求(POST或者GET) 获取会话的CooKie 并根据该CooKie继续访问登录后的页面,获取后续访问的页面数据. ...

随机推荐

q.js实现nodejs顺序调用
nodejs的异步调用有时候是最让人头疼的,如何能是一些代码顺序的执行呢,这里和大家分享nodejs的promise 什么是promise promise一个标准,它描述了异步调用的返回结果,包括正确 ...
Oracle 归档路径
Oracle 的归档路径设置,这里主要按照官网说明记录 LOG_ARCHIVE_DEST_n 与 LOG_ARCHIVE_DEST_STATE_n 这两个参数. 我使用的数据库是11.2版本,这两个参 ...
Facebook发布C++ HTTP框架Proxygen
Facebook 宣布发布C++ HTTP 框架 Proxygen,其中包括了一个 HTTP server.Proxygen 是 oxygen 的谐音,支持 SPDY/3 和 SPDY/3.1,未来还 ...
jquery编写的简单日历
以前在开发web页面的时候遇到日历,都是直接引入一些日历组件来用,一直不太明白实现原理,总感觉挺复杂的. 今天尝试着用jquery写了一个简单的日历功能,可以选择年份,月份,返回今天,原来简单的日历功 ...
Memcached管理与监控工具 memAdmin
http://www.junopen.com/memadmin/ 使用MemCached以后,肯定希望知道cache的效果,对于MemCached的一些运行状态进行监控是必要的,memcached提供 ...
ping-tool
https://serve.netsh.org/pub/ping-tool/ https://serve.netsh.org/pub/ipv4-hosts/
关于IE的兼容模式
前言为了帮助确保你的网页在所有未来的IE版本都有一致的外观,IE8引入了文件兼容性.在IE6中引入一个增设的兼容性模式,文件兼容性使你能够在IE呈现你的网页时选择特定编译模式. 新的IE为了确保网页 ...
初探ListView和Adapter
关于Android Adapter(适配器),参考Devin Zhang’s blog.简单的说,Adapter起到的作用是使得前端的显示和后端的数据能够适配,用以下代码作为例子 1234567891 ...
NBA工资帽
工资帽(Salary cap):在NBA,工资帽是最著名工资限制条款. 每年的"工资帽"是依据NBA前一年的总收入,然后取这个总收入的48%作为NBA球队工资总额. 再拿这48%的 ...
CSS3实战开发表单发光特效实战开发
首先,我们先准备好html代码: <!doctype html> <html> <head> <meta charset="utf-8"& ...

python3 模拟登录网站

python3 模拟登录网站的更多相关文章

随机推荐

热门专题