使用po模式读取豆瓣读书最受关注的书籍,取出标题、评分、评论、题材 按评分从小到大排序并输出到txt文件中
#coding=utf-8
from time import sleep
import unittest
from selenium import webdriver
from selenium.webdriver import Remote
from selenium.webdriver.common.by import By#元素定位
import sys
def browser():#启动浏览器驱动
'''
driver = Remote(command_executor='http://127.0.0.1:4444/wd/hub',
desired_capabilities={'platform':'ANY',
'browserName':'chrome',
'version':'',
})'''
driver = webdriver.Ie()
return driver
class MyTest(unittest.TestCase):#框架
def setUp(self):
print("开始执行用例!")
self.driver = browser()
self.driver.implicitly_wait(10)
self.driver.maximize_window()
def tearDown(self):
self.driver.quit()
print('用例执行结束!')
class Page(object):#基础类
'''
页面基础类,用于所有页面的继承
'''
bbs_url = 'https://book.douban.com/'
def __init__(self,selenium_driver,base_url=bbs_url,parent=None):#初始化
self.base_url = base_url
self.driver = selenium_driver
self.timeout = 30
self.parent = parent
def on_page(self):#断言url是否相等
return self.driver.current_url == (self.base_url + self.url)
def _open(self,url):
url = self.base_url + url
self.driver.get(url)
assert self.on_page(),'获取的url和当前url不匹配.url:%s' % url
def open(self):#打开浏览器
self._open(self.url)
def find_element(self,*loc):#单个元素定位
return self.driver.find_element(*loc)
def find_elements(self,*loc):#多个元素定位
return self.driver.find_elements(*loc)
class Douban_film(Page):#页面对象封装
u'''豆瓣读书排序'''
url = '/'
#元素定位
bbs_booknum_loc = (By.XPATH,'//li/div[2]/p[1]/span[2]')#评分
bbs_bookname_loc = (By.XPATH,'//li/div[2]/h4/a')#书名
bbs_bookauther_loc = (By.XPATH,'//li/div[2]/p[2]')#作者
bbs_booktype_loc = (By.XPATH,'//li/div[2]/p[3]')#类型
bbs_bookcomments_loc = (By.XPATH,'//li/div[2]/p[5]')#评论
#元素封装
def bbs_bookname(self):#豆瓣评分
_input = self.driver.find_elements(*self.bbs_bookname_loc)# 选择页面上所有的tag name 为input 的元素
bookname = []
for i in _input:
bookname.append(i.text)#取出值并添加到数组
else:
sleep(1)
return bookname
def bbs_booknum(self):#豆瓣评分
_input = self.driver.find_elements(*self.bbs_booknum_loc)# 选择页面上所有的tag name 为input 的元素
booknum = []
for i in _input:
booknum.append(i.text)#取出值并添加到数组
else:
sleep(1)
return booknum
def bbs_bookauther(self):#作者
_input = self.driver.find_elements(*self.bbs_bookauther_loc)# 选择页面上所有的tag name 为input 的元素
bookauther = []
for i in _input:
bookauther.append(i.text)#取出值并添加到数组
else:
sleep(1)
return bookauther
def bbs_booktype(self):#类型
_input = self.driver.find_elements(*self.bbs_booktype_loc)# 选择页面上所有的tag name 为input 的元素
bookautype = []
for i in _input:
bookautype.append(i.text)#取出值并添加到数组
else:
sleep(1)
return bookautype
def bbs_bookcomments(self):#评论
_input = self.driver.find_elements(*self.bbs_bookcomments_loc)# 选择页面上所有的tag name 为input 的元素
bookaucomments = []
for i in _input:
bookaucomments.append(i.text)#取出值并添加到数组
else:
sleep(1)
return bookaucomments
def out_node(self):#排序
list1 = self.bbs_booknum()
list2 = self.bbs_bookname()
list3 = self.bbs_bookauther()
list4 = self.bbs_booktype()
list5 = self.bbs_bookcomments()
list = [[a,b,c,d,e] for a,b,c,d,e in zip(list1,list2,list3,list4,list5)]
team = list[:]
team.sort()
print('从小到大排序:%s'%team)
return team
def writetxt(self):#写入txt文件
a = self.out_node()
f1 = open('b.txt','w',encoding='utf-8')#写入文件编码格式,不写的话有时候会导致解析错误
for i in a:#循环读取内嵌列表
#if isinstance(i,list):#判断是否是一个列表
print(i)#分别打印内嵌列表里的列表
f1.writelines(i)#写入txt文件
f1.write('\n')#写入文件时换行
f1.close()
class test_Douban_film(MyTest):
u'''豆瓣读书排序'''
def test1(self):
u'''豆瓣评分按降序排列并保存到txt文件'''
p1 = Douban_film(self.driver)
p1.open()
p1.writetxt()
if __name__ == '__main__':
unittest.main()
使用po模式读取豆瓣读书最受关注的书籍,取出标题、评分、评论、题材 按评分从小到大排序并输出到txt文件中的更多相关文章
- 按行读取TXT文件中的内容
public Dictionary<int, string> GetDicFromLog() { try { StreamReader sr = new StreamReader(file ...
- 从txt文件中读取数据放在二维数组中
1.我D盘中的test.txt文件内的内容是这样的,也是随机产生的二维数组 /test.txt/ 5.440000 3.4500006.610000 6.0400008.900000 3.030000 ...
- 读取同一文件夹下多个txt文件中的特定内容并做统计
读取同一文件夹下多个txt文件中的特定内容并做统计 有网友在问,C#读取同一文件夹下多个txt文件中的特定内容,并把各个文本的数据做统计. 昨晚Insus.NET抽上些少时间,来实现此问题,加强自身的 ...
- SQL C# nvarchar类型转换为int类型 多表查询的问题,查询结果到新表,TXT数据读取到控件和数据库,生成在控件中的数据如何存到TXT文件中
在数据库时候我设计了学生的分数为nvarchar(50),是为了在从TXT文件中读取数据插入到数据库表时候方便,但是在后期由于涉及到统计问题,比如求平均值等,需要int类型才可以,方法是:Conver ...
- Java中读取txt文件中中文字符时,出现乱码的解决办法
这是我写的一个Java课程作业时,遇到的问题. 问题描述: 我要实现的就是将txt文件中的内容按一定格式读取出来后,存放在相应的数组. 我刚开始运行时发现,英文可以实现,但是中文字符就是各种乱码. 最 ...
- Flex读取txt文件中的内容(三)
Flex读取txt文件中的内容 1.设计源码 LoadTxt.mxml: <?xml version="1.0" encoding="utf-8"?> ...
- Flex读取txt文件中的内容(二)
Flex读取txt文件中的内容 自动生成的文件 LoadTxt-app.xml: <?xml version="1.0" encoding="utf-8" ...
- Flex读取txt文件中的内容(一)
Flex读取txt文件中的内容 phone.txt: 13000003847 13000003848 13000003849 13000003850 13000003851 13000003852 1 ...
- Flex读取txt文件中的内容报错
Flex读取txt文件中的内容 1.具体错误如下 2.错误原因 读取文件不存在 var file:File = new File(File.applicationDirectory.nativePat ...
随机推荐
- 【.net 深呼吸】细说CodeDom(5):类型成员
前文中,老周已经厚着脸皮介绍了类型的声明,类型里面包含的自然就是类型成员了,故,顺着这个思路,今天咱们就了解一下如何向类型添加成员. 咱们都知道,常见的类型成员,比如字段.属性.方法.事件.表示代码成 ...
- premere cs4绿色版 安装 并且 视频导出 讲解
最近室友,开始在玩视频剪辑,用的是 premere cs4 绿色版.让他遇到的最大问题也是我之前遇到的最大问题,就是视频导出. 所以我在这里上传一套自己的一点点经验吧. 接下来,我就总结一下 我是怎么 ...
- C#多线程之基础篇3
在上一篇C#多线程之基础篇2中,我们主要讲述了确定线程的状态.线程优先级.前台线程和后台线程以及向线程传递参数的知识,在这一篇中我们将讲述如何使用C#的lock关键字锁定线程.使用Monitor锁定线 ...
- Java 字符串格式化详解
Java 字符串格式化详解 版权声明:本文为博主原创文章,未经博主允许不得转载. 微博:厉圣杰 文中如有纰漏,欢迎大家留言指出. 在 Java 的 String 类中,可以使用 format() 方法 ...
- CSS 3学习——文本效果和@font-face
文本效果 关于文本效果,这里仅仅记录得到大多数浏览器支持的几个属性,分别是: text-overflow text-shadow word-break word-wrap text-overflow ...
- JDK动态代理
一.基本概念 1.什么是代理? 在阐述JDK动态代理之前,我们很有必要先来弄明白代理的概念.代理这个词本身并不是计算机专用术语,它是生活中一个常用的概念.这里引用维基百科上的一句话对代理进行定义: A ...
- C#~异步编程再续~await与async引起的w3wp.exe崩溃-问题友好的解决
返回目录 关于死锁的原因 理解该死锁的原因在于理解await 处理contexts的方式,默认的,当一个未完成的Task 被await的时候,当前的上下文将在该Task完成的时候重新获得并继续执行剩余 ...
- Linux设备管理(四)_从sysfs回到ktype
sysfs是一个基于ramfs的文件系统,在2.6内核开始引入,用来导出内核对象(kernel object)的数据.属性到用户空间.与同样用于查看内核数据的proc不同,sysfs只关心具有层次结构 ...
- C#编写windows服务,多服务为什么只启动一个(ServiceBase.Run)
https://zhidao.baidu.com/question/380395667.html //多服务一个宿主程序时必须注间以下要点: Service1的ServiceName 必须 Insta ...
- 用Taurus.MVC 做个企业站(下)
前言: 上一篇完成了首页,这一篇就把剩下的几个功能给作了吧. 包括文章列表.文章详情和产品展示. 1:文章列表: 原来的ArticleList.aspx 1:现在的articlelist.html 除 ...