python selenium爬取QQ空间方法

from selenium import webdriver

import time

# 打开浏览器

dr = webdriver.Chrome()

# 打开某个网址

dr.get('https://user.qzone.qq.com/2330331400/main')

# 切换框架

dr.switch_to_frame('login_frame')

time.sleep(1)

dr.find_element_by_link_text('帐号密码登录').click()

# 输入账号

dr.find_element_by_xpath('//*[@id="u"]').send_keys('')

time.sleep(8)

# 点击登录

dr.find_element_by_xpath('//*[@id="login_button"]').click()

time.sleep(2)

# 点击个人档

dr.find_element_by_xpath('//*[@id="menuContainer"]/div/ul/li[6]/a').click()

time.sleep(2)

# 请求好友的空间地址

dr.get('https://user.qzone.qq.com/481135195')

time.sleep(3)

# dr.switch_to_alert()

# dr.find_element_by_link_text('我知道了').click()

# 点击好友的个人档

dr.find_element_by_xpath('//*[@id="menuContainer"]/div/ul/li[6]/a').click()

time.sleep(1)

# 切换框架

dr.switch_to_frame('app_canvas_frame')

# 点击好友的个人资料

dr.find_element_by_link_text('个人资料').click()

# dr.find_element_by_link_text('//*[@id="info_link"]').click()

# 输入当前页面的源代码

print(dr.page_source)

dr.get('https://user.qzone.qq.com/495483884')

time.sleep(3)

# dr.switch_to_alert()

# dr.find_element_by_link_text('我知道了').click()

dr.find_element_by_xpath('//*[@id="menuContainer"]/div/ul/li[6]/a').click()

time.sleep(1)

dr.switch_to_frame('app_canvas_frame')

dr.find_element_by_link_text('个人资料').click()

# dr.find_element_by_link_text('//*[@id="info_link"]').click()

print(dr.page_source)

python selenium爬取QQ空间方法的更多相关文章

selenium爬取qq空间，requests爬取雪球网数据
一.爬取qq空间好友动态数据 # 爬取qq空间好友状态信息(说说,好友名称),并屏蔽广告 from selenium import webdriver from time import sleep f ...
python+selenium+requests爬取qq空间相册时遇到的问题及解决思路
最近研究了下用python爬取qq空间相册的问题,遇到的问题及解决思路如下: 1.qq空间相册的访问需要qq登录并且需是好友,requests模块模拟qq登录略显麻烦,所以采用selenium的dri ...
使用Python+Selenium模拟登录QQ空间
使用Python+Selenium模拟登录QQ空间爬QQ空间之类的页面时大多需要进行登录,研究QQ登录规则的话,得分析大量Javascript的加密解密,这绝对能掉好几斤头发.而现在有了seleniu ...
Python+Selenium爬取动态加载页面（2）
注: 上一篇<Python+Selenium爬取动态加载页面(1)>讲了基本地如何获取动态页面的数据,这里再讲一个稍微复杂一点的数据获取全国水雨情网.数据的获取过程跟人手动获取过程类似,所 ...
Python+Selenium爬取动态加载页面（1）
注: 最近有一小任务,需要收集水质和水雨信息,找了两个网站:国家地表水水质自动监测实时数据发布系统和全国水雨情网.由于这两个网站的数据都是动态加载出来的,所以我用了Selenium来完成我的数据获取. ...
Python爬虫使用selenium爬取qq群的成员信息（全自动实现自动登陆）
前言本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者: python小爬虫 PS:如有需要Python学习资料的小伙伴可以 ...
Python_小林的爬取QQ空间相册图片链接程序
前言昨天看见某人的空间有上传了XXXX个头像,然后我就想着下载回来[所以本质上这是一个头像下载程序],但是一个个另存为太浪费时间了,上网搜索有没有现成的工具,居然要注册码,还卖45一套.你们的良心也 ...
用python爬取QQ空间
好久没写博文了,最近捣鼓了一下python,好像有点上瘾了,感觉python比js厉害好多,但是接触不久,只看了<[大家网]Python基础教程(第2版)[www.TopSage.com]> ...
Python爬虫实战：使用Selenium抓取QQ空间好友说说
前面我们接触到的,都是使用requests+BeautifulSoup组合对静态网页进行请求和数据解析,若是JS生成的内容,也介绍了通过寻找API借口来获取数据. 但是有的时候,网页数据由JS生成,A ...

随机推荐

SQL SERVER pivot（行转列），unpivot（列转行）
[pivot]行转列:多行变一列假设学生成绩表Score1 Name Subject Score 小张语文 88 小花数学 89 小张数学 90 Name 语文数学小花 null 89 小 ...
dp 二维乃至多维背包
洛谷P1855 榨取kkksc03 分析:套路是很明显的01背包,但是这时受约束的变量有两个了,这种情况下就该用多维背包了分析方法一样的,用dp[i][j][k]表示从前i个愿望中挑选总时间和总金钱 ...
node模块之path——path.join和path.resolve的区别
1.path.join([...paths]) path.join() 方法使用平台特定的分隔符把全部给定的 path 片段连接到一起,并规范化生成的路径. 长度为零的 path 片段会被忽略. 如果 ...
python-django rest framework框架之分页
1. 以前django做的分页组件当数据量特别大的时候,性能不是很高,有以下三种方式处理: a. 记录当前访问页的最后一条数据id,往后取多少条 b. 最多显示120页 ...
js 处理 cookie的存储与删除
<script> //JS操作cookies方法! //写cookies function setCookie(c_name, value, expiredays){ var exdate ...
【LeetCode】区间合并
给定一组区间,将所有区间重叠的部分合并起来. e.g. 给出 { [1, 3], [2, 6], [8, 10], [15, 18] },返回 { [1, 6], [8, 10], [15, 18] ...
python assert使用说明
python assert断言的作用 python assert断言是声明其布尔值必须为真的判定,如果发生异常就说明表达示为假. assert断言语句的语法格式判断a与1.b是否一致,msg类似备注 ...
InnoDB行记录格式(compact)、InnoDB数据页结构
1. compact 行记录格式: 变长字段长度列表,null标志位,记录头信息,列1数据,列2数据 …… 记录头信息中包含许多信息,只列举一部分: 名称大小描述 deleted_flag 1bi ...
URL加载jar
// !/test.xml 是表示jar中的test.xml文件 final URL jarUrl = new URL("jar:file:/C:/proj/parser/jar/parse ...
Struts初步入门（四）
1.默认Action-深入Struts struts.xml 文件: <struts> <package name="default" namespace=&qu ...

python selenium爬取QQ空间方法

python selenium爬取QQ空间方法的更多相关文章

随机推荐

热门专题