python变现实现新浪微博登陆
新浪微博的登陆现在是越来越那个了,以前的模拟浏览器登陆新浪微博貌似也越来不管用了
登陆信息由以前的form变成了现在javascript,javascript的加载居然用了一个javascript的函数加载,真是。。。。。
可是突然发现,新浪微博的加强仅限于微博,其他的新浪产品还是一般的网页
相信大家也知道,只要在一个新浪的产品登陆,然后自然的就可以不用登陆就可以登陆上其他产品了
1:安装python的模拟浏览器module,这里用的是mechanize,自己百度下载安装就好了,这不懂的话没必要继续看下去了(开玩笑,可以评论,我教你^_^)
2:登陆新浪通行证
3:登陆新浪微博
4:在新浪微博中搜索
在最后有我自己实现的python代码:
这里说点其他的:
1:怎么拿到自己浏览器的cookie,我拿chrome浏览器作为例子:
打开http://login.sina.com.cn/signup/signin.php?entry=sso,按下F12,点network,然后输入账号密码登陆,加载完后点击左边的链接,然后右边的点击headers,找到cookie填到下面代码的对应cookie的位置就好了
2:登陆新浪微博一般是扒数据,微博的搜索框是一个重要来源,不拿发现,中文的搜索中的中文是经过编码的,自己对比一般网页的url编码,不难发现新浪微博的url编码对中文的utf8编码还加了25,自己加上就好了
3:其他的也没什么难的了,
#*-* coding:utf-8 *-*
import mechanize
import cookielib
import urllib
import sys
br = mechanize.Browser() #cookie jar
cj = cookielib.LWPCookieJar()
br.set_cookiejar(cj)
#加上各种协议
br.set_handle_equiv(True)
br.set_handle_gzip(True)
br.set_handle_redirect(True)
br.set_handle_referer(True)
br.set_handle_robots(False) br.set_handle_refresh(mechanize._http.HTTPRefreshProcessor(),max_time=1)
#加上自己浏览器头部,和登陆了通行证的cookie
br.addheaders=[('User-Agent','Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/35.0.1916.153 Safari/537.36'),
('Cookie','在这里把自己的cookie放在这里,很长的一串东西')
] # for f in br.forms():
# print f
# br.select_form(nr=0)
# print br
# br.form['username']='13580491531'
# br.form['password']='buhui1314iliting'
# br.submit()
# br.add_password('http://login.sina.com.cn/signup/signin.php?entry=sso','13580491531','buhui1314iliting')
#登陆新浪通行证
br.open('http://login.sina.com.cn/signup/signin.php?entry=sso') t = br.response().read()
f = open("ht.html","w")
f.write(t)
f.close()
#登陆新浪微博
br.open('http://weibo.com')
t = br.response().read()
f = open("htm.html","w")
f.write(t)
f.close()
#输入查询关键字
tips='请输入查询关键词,按回车键结束:'
# tips = tips.decode('utf-8')
query = raw_input(tips)
#对查询进行url的utf8编码,中文才需要编码,英文不需要
#sys.stdin.encoding表示系统默认的编码
query = urllib.quote(query.decode(sys.stdin.encoding).encode('utf8'))
#新浪微博的查询是在url的utf8编码的基础上在%后加上25
query = query.replace('%','%25')
#print query
br.open('http://s.weibo.com/weibo/'+query)
print br.response().geturl()
t = br.response().read()
f = open("html.html","w")
f.write(t)
f.close()
python变现实现新浪微博登陆的更多相关文章
- 新浪微博登陆以及发送微博(附python源码)
原文链接(本人):https://blog.csdn.net/A5878989/article/details/76275855 说明 本文主要记录分析新浪微博登陆以及发送文字和图片微博的详细过程 分 ...
- [Javascript] 爬虫 模拟新浪微博登陆
概述: 由于业务需要,要编写爬虫代码去爬去新浪微博用户的信息. 虽然在网上能找到不少信息,但由于新浪微博改版,其登陆机制进行了修改,故很多老的文章就不适合用了. 经过一番摸索,成功模拟新浪微博的登陆 ...
- python抓取新浪微博评论并分析
1,实现效果 watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQveGlhb2xhbnphbw==/font/5a6L5L2T/fontsize/400/fill ...
- python urllib2 模拟网站登陆
python urllib2 模拟网站登陆 1. 可用浏览器先登陆,然后查看网页源码,分析登录表单 2. 使用python urllib2,cookielib 模拟网页登录 import urllib ...
- Java模拟新浪微博登陆抓取数据
前言: 兄弟们来了来了,最近有人在问如何模拟新浪微博登陆抓取数据,我听后默默地抽了一口老烟,暗暗的对自己说,老汉是时候该你出场了,所以今天有时间就整理整理,浅谈一二. 首先: 要想登陆新浪微博需要 ...
- Python实现网站模拟登陆
一.实验简介 1.1 基本介绍 本实验中我们将通过分析登陆流程并使用 Python 实现模拟登陆到一个实验提供的网站,在实验过程中将学习并实践 Python 的网络编程,Python 实现模拟登陆的方 ...
- 使用python的Paramiko模块登陆SSH
使用python的Paramiko模块登陆SSH paramiko是用Python语言写的一个模块,遵循SSH2协议,支持以加密和认证的方式,进行远程服务器的连接. python的paramiko模块 ...
- Python tkinter 实现简单登陆注册 基于B/S三层体系结构,实现用户身份验证
Python tkinter 实现简单登陆注册 最终效果 开始界面 注册 登陆 源码 login.py # encoding=utf-8 from tkinter import * from ...
- Redis & Python/Django 简单用户登陆
一.Redis key相关操作: 1.del key [key..] 删除一个或多个key,如果不存在则忽略 2.keys pattern keys模式匹配,符合glob风格通配符,glob风格的通配 ...
随机推荐
- NO7——二分
int binsearch(int *t,int k,int n) {//t为数组,k是要查找的数,n为长度,此为升序 ,high = n,mid; while(low<=high) { mid ...
- 【翻译】ASP.NET Core 文档目录
微软官方CORE 2.0正式版中文文档已经出来了,地址:https://docs.microsoft.com/zh-cn/aspnet/core/ 简介 入门 创建一个Web应用程序 创建一个Web ...
- java long值转成时间格式
/** * 将long值转换为以小时计算的格式 * @param mss * @return */ public static String formatLongTime(long mss) { St ...
- windows redis+lua的调试
1.编写lua脚本my.lua local key = KEYS[1] --限流KEY(一秒一个) local limit = tonumber(ARGV[1]) --限流大小 local curre ...
- c++ map 和 unordered_map的区别
unordered_map和map类似,都是存储的key-value的值,可以通过key快速索引到value.不同的是unordered_map不会根据key的大小进行排序, 存储时是根据key的ha ...
- Aspose.words 替换字符 操作
var path = Server.MapPath("~/doc/demo.doc"); Document doc = new Document(path); DocumentBu ...
- EF 4.0 升级到 6.0 问题解决办法
1.工具->库程序包管理器-> 管理解决方案的Nuget 程序包 找到EntityFramework 管理,勾选把需要进入 EF6.0的 项目,进行升级.
- 常见的位运算技巧总结(膜wys)
看了wys的论文,感觉获得了不少新姿势 这里总结一下 #include <iostream> using namespace std; typedef unsigned int u32; ...
- 利用npm安装/删除/发布/更新/撤销发布包
利用npm安装/删除/发布/更新/撤销发布包 什么是npm? npm是javascript的包管理工具,是前端模块化下的一个标志性产物 简单地地说,就是通过npm下载模块,复用已有的代码,提高工作效率 ...
- [BZOJ1283]序列
Description 给出一个长度为n的正整数序列Ci,求一个子序列,使得原序列中任意长度为m的子串中被选出的元素不超过K(K,M<=100) 个,并且选出的元素之和最大. Input 第1行 ...