python扒取百宝彩网站江西快三当日期号及开奖结果
一、环境
windows10+python27
二、需求:
1、获取百宝彩网站中,江西快三当日的开奖期号和中奖号码;
2、根据输入期号,输出开奖号码;
三、上代码
#!/bin/env python # coding=utf-8 import urllib2 import time import re class GetK3Issue: """ 获取百宝彩网站快三当日输入的期号 """ def __init__(self, url=0, page=0, sys_time=0): """ 初始化参数 """ self.url = url self.page = page self.sys_time = sys_time def get_url_page(self): """ 获取页面返回元素 """ self.sys_time = time.strftime('%Y-%m-%d', time.localtime(time.time())) self.url = 'http://www.baibaocp.com/ks/history/lotid/10412/date/%s' % self.sys_time self.page = urllib2.urlopen(self.url).read().decode('utf8') return self.page def get_issue(self): """ 从页面返回元素中提取开奖期号 """ issue_list = [] page = self.get_url_page() RE = re.compile(ur'<tr num=\'\d{9}') element_list = re.findall(RE, page) for element in element_list: issue = str(element[9:18]) issue_list.append(issue) return list(issue_list) def get_winning_numbers(self): """ 从页面返回元素中获取开奖号码 """ numbers_list = [] group_numbers_list = [] page = self.get_url_page() RE = re.compile(ur"class='history_drawnumber'><span>.*</span>") element_numbers_list = re.findall(RE, page) list_a = str(element_numbers_list) RE2 = re.compile(ur'\d{1}</span>') numbers_str = re.findall(RE2, list_a) for dangezhi in numbers_str: numbers = dangezhi[0] numbers_list.append(numbers) i = 0 while True: j = i + 3 winning_numbers = numbers_list[i:j] i = j if j >= len(numbers_list)+3: break group_numbers_list.append(winning_numbers) return group_numbers_list def result_dict(self): """ 合并期号和开奖号码列表,返回字典 """ issue = self.get_issue().__iter__() result = dict(zip(issue, self.get_winning_numbers())) return result def get_issue_by_dict(self): """ 通过输入期号查找开奖号码 """ input_issue = str(raw_input(u'请输入你想要查询的期号: ')) result_list = self.result_dict() if input_issue in result_list: number = result_list[input_issue] print '今日第%s期开奖结果是:%s' % (input_issue, number) else: print '输入期号有误!!!' if __name__ == '__main__': run = GetK3Issue() run.get_issue_by_dict()
python扒取百宝彩网站江西快三当日期号及开奖结果的更多相关文章
- Python 爬取淘宝商品数据挖掘分析实战
Python 爬取淘宝商品数据挖掘分析实战 项目内容 本案例选择>> 商品类目:沙发: 数量:共100页 4400个商品: 筛选条件:天猫.销量从高到低.价格500元以上. 爬取淘宝商品 ...
- 使用Python爬取淘宝两千款套套
各位同学们,好久没写原创技术文章了,最近有些忙,所以进度很慢,给大家道个歉. 警告:本教程仅用作学习交流,请勿用作商业盈利,违者后果自负!如本文有侵犯任何组织集团公司的隐私或利益,请告知联系猪哥删除! ...
- 甜咸粽子党大战,Python爬取淘宝上的粽子数据并进行分析
前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 爬虫 爬取淘宝数据,本次采用的方法是:Selenium控制Chrome浏览 ...
- Python爬取淘宝店铺和评论
1 安装开发需要的一些库 (1) 安装mysql 的驱动:在Windows上按win+r输入cmd打开命令行,输入命令pip install pymysql,回车即可. (2) 安装自动化测试的驱动s ...
- 【Python爬虫案例学习】Python爬取淘宝店铺和评论
安装开发需要的一些库 (1) 安装mysql 的驱动:在Windows上按win+r输入cmd打开命令行,输入命令pip install pymysql,回车即可. (2) 安装自动化测试的驱动sel ...
- 一篇文章教会你用Python爬取淘宝评论数据(写在记事本)
[一.项目简介] 本文主要目标是采集淘宝的评价,找出客户所需要的功能.统计客户评价上面夸哪个功能多,比如防水,容量大,好看等等. 很多人学习python,不知道从何学起.很多人学习python,掌握了 ...
- python爬取安居客二手房网站数据(转)
之前没课的时候写过安居客的爬虫,但那也是小打小闹,那这次呢, 还是小打小闹 哈哈,现在开始正式进行爬虫书写 首先,需要分析一下要爬取的网站的结构: 作为一名河南的学生,那就看看郑州的二手房信息吧! 在 ...
- 如何用 Python 爬取需要登录的网站
[原文地址:]http://python.jobbole.com/83588/ import requests from lxml import html # 创建 session 对象.这个对象会保 ...
- 【Python爬虫案例学习】python爬取淘宝里的手机报价并以价格排序
第一步: 先分析这个url,"?"后面的都是它的关键字,requests中get函数的关键字的参数是params,post函数的关键字参数是data, 关键字用字典的形式传进去,这 ...
随机推荐
- UVA - 10339-Watching Watches
10339 - Watching Watches Time limit: 3.000 seconds It has been said that a watch that is stopped kee ...
- C#、.NET Framework、CLR的关系
很多人没有将C#..NET Framework(.NET框架).CLR(Common Language Runtime,公共语言运行库)这三者之间的关系区分清楚,认为其版本号是一一对应的.其实不然,. ...
- html5 文本格式化
通常标签 <strong> 替换加粗标签 <b> 来使用, <em> 替换 <i>标签使用.然而,这些标签的含义是不同的:<b> 与< ...
- Linux-vmware tools安装与cdrom挂载(转)
昨天想直接复制虚拟机centos系统中命令行的内容到主机的txt文档上进行保存,发现不能实现虚拟机与主机之间的直接通讯,后来查资料发现原来是由于我的虚拟机没有安装vwmare tools的缘故. 一个 ...
- 关于数据库timestamp类型问题
数据库使用timestamp类型字段,默人时间为0000-00-00 00:00:00 于是后台会报java.sql.SQLException: Value '0000-00-00 00:00:00' ...
- rexray在CentOS上不能创建ceph rbd的docker volume问题定位
背景 我们通过docker的rexray插件来创建ceph rbd设备的docker volume,但总提示创建失败. # docker volume create --driver=rexray - ...
- 使用django建博客时遇到的URLcon相关错误以及解决方法。错误提示:类型错误:include0获得一个意外的关键参数app_name
root@nanlyvm:/home/mydj/mysite# python manage.py runserver Performing system checks... Unhandled exc ...
- J.U.C FutureTask之源码解析
通过直接继承Thread, 实现Runnable接口来创建线程.但这两种方式都有一种缺陷:在执行完任务之后无法获得执行结果. 如果需要获得执行结果,就必须通过共享变量或者使用线程通信的方式来达到效果, ...
- React Native学习(八)—— 对接七鱼客服
本文基于React Native 0.52 Demo上传到Git了,有需要可以看看,写了新内容会上传的.Git地址 https://github.com/gingerJY/React-Native-D ...
- 流程控制语句if、else、elif、break、continue
1.控制流程 # if 判断语句 a = 12 if a>0: print('a大于0') if a<5: print('a大于5') else: print('哈哈哈') 2.基本形式: ...