python抓取汇率
# -*- coding: utf-8 -*-
"""
获取实时汇率
Created on Fri Oct 18 13:11:40 2013 @author: alala
""" import httplib
import re
import MySQLdb
import datetime URL = 'fx.cmbchina.com' #网站名
PATH = '/hq/' #页面路径
HOST = 'localhost' #数据库地址(ip)
DB = "money" #数据库名称
USER = 'root' #数据库用户名
PSWD = 'sheet' #数据库密码 httpClient = None try:
#抓去网页内容
httpClient = httplib.HTTPConnection(URL, 80, timeout=30)
httpClient.request('GET', '/hq/')
response = httpClient.getresponse()
html = response.read()
#print html #用正则表达式抓去汇率数据
reg = re.compile(r"""
<tr>\s*<td\s+class="fontbold">\s*(?P<name>\S+)\s*</td>\s* #交易币
<td\s+align="center">\s*(?P<unit>\d+)\s*</td>\s* #交易币单位
<td\s+align="center"\s+class="fontbold">\s*(?P<base>\S+)\s*</td>\s* #基本币
<td\s*class="numberright">\s*(?P<midPrice>\d+\.\d+)\s*</td>\s* #中间价
<td\s*class="numberright">\s*(?P<sellPrice>\d+\.\d+)\s*</td>\s* #卖出价
<td\s*class="numberright">\s*(?P<buyPrice1>\d+\.\d+)\s*</td>\s* #现汇买入价
<td\s*class="numberright">\s*(?P<buyPrice2>\d+\.\d+)\s*</td>\s* #现钞买入价
<td\s*align="center">\s*(?P<time>\d+:\d+:\d+)\s*</td>\s* #时间
""", re.MULTILINE | re.X)
rows = reg.findall(html)
#打印汇率数据
for r in rows:
print ','.join(map(str,r)), '\n' #数据库操作
#确保mysqldb已经安装,可以用下面的命令安装
#pip install MySQL-python #建立和数据库系统的连接
conn = MySQLdb.connect(host=HOST, user=USER,passwd=PSWD) #获取操作游标
cursor = conn.cursor()
#执行SQL,创建一个数据库.
cursor.execute("CREATE DATABASE IF NOT EXISTS " + DB) #选择数据库
conn.select_db(DB);
#执行SQL,创建一个数据表.
cursor.execute("""CREATE TABLE IF NOT EXISTS exchange_rate(
name VARCHAR(50) COMMENT '交易币' PRIMARY KEY,
unit INT COMMENT '交易币单位',
base VARCHAR(50) COMMENT '基本币',
midPrice FLOAT COMMENT '中间价',
sellPrice FLOAT COMMENT '卖出价',
buyPrice1 FLOAT COMMENT '现汇买入价',
buyPrice2 FLOAT COMMENT '现钞买入价',
time DATETIME COMMENT '时间' ) """)
records = []
for r in rows:
(name,unit,base,midPrice,sellPrice,buyPrice1,buyPrice2,time) = r
time = datetime.datetime.strptime(datetime.datetime.now().strftime('%Y-%m-%d')
+ " " + time,'%Y-%m-%d %H:%M:%S')
record = (name,int(unit),base,float(midPrice),float(sellPrice),
float(buyPrice1),float(buyPrice2),time)
records.append(record)
#print records
#更新汇率
cursor.executemany("REPLACE exchange_rate VALUES(%s,%s,%s,%s,%s,%s,%s,%s)"
,records);
conn.commit() #关闭连接,释放资源
cursor.close(); except Exception,e:
print e
finally:
if httpClient:
httpClient.close()
python抓取汇率的更多相关文章
- Python 抓取网页并提取信息(程序详解)
最近因项目需要用到python处理网页,因此学习相关知识.下面程序使用python抓取网页并提取信息,具体内容如下: #---------------------------------------- ...
- 使用 Python 抓取欧洲足球联赛数据
Web Scraping在大数据时代,一切都要用数据来说话,大数据处理的过程一般需要经过以下的几个步骤 数据的采集和获取 数据的清洗,抽取,变形和装载 数据的分析,探索和预测 ...
- python抓取性感尤物美女图
由于是只用标准库,装了python3运行本代码就能下载到多多的美女图... 写出代码前面部分的时候,我意识到自己的函数设计错了,强忍继续把代码写完. 测试发现速度一般,200K左右的下载速度,也没有很 ...
- python抓取网页例子
python抓取网页例子 最近在学习python,刚刚完成了一个网页抓取的例子,通过python抓取全世界所有的学校以及学院的数据,并存为xml文件.数据源是人人网. 因为刚学习python,写的代码 ...
- Python抓取页面中超链接(URL)的三中方法比较(HTMLParser、pyquery、正则表达式) <转>
Python抓取页面中超链接(URL)的3中方法比较(HTMLParser.pyquery.正则表达式) HTMLParser版: #!/usr/bin/python # -*- coding: UT ...
- 如何用python抓取js生成的数据 - SegmentFault
如何用python抓取js生成的数据 - SegmentFault 如何用python抓取js生成的数据 1赞 踩 收藏 想写一个爬虫,但是需要抓去的的数据是js生成的,在源代码里看不到,要怎么才能抓 ...
- 关于python抓取google搜索结果的若干问题
关于python抓取google搜索结果的若干问题 前一段时间一直在研究如何用python抓取搜索引擎结果,在实现的过程中遇到了很多的问题,我把我遇到的问题都记录下来,希望以后遇到同样问题的童 ...
- 用python抓取智联招聘信息并存入excel
用python抓取智联招聘信息并存入excel tags:python 智联招聘导出excel 引言:前一阵子是人们俗称的金三银四,跳槽的小朋友很多,我觉得每个人都应该给自己做一下规划,根据自己的进步 ...
- python抓取月光博客的全部文章而且依照标题分词存入mongodb中
猛击这里:python抓取月光博客的全部文章
随机推荐
- 一款点击图片进行无限循环的jquery手风琴特效
一款点击图片进行无限循环的jquery手风琴特效,点击手风琴折合点,可以无限循环的点击下去,很炫酷的手风琴哟! 还有每张图片的文字介绍,因为兼容IE6所以找来分享给大家这个jquery特效. 适用浏览 ...
- asp.net中两款文本编辑器NicEdit和Kindeditor
过Web开发的朋友相信都使用过富文本编辑器,比较出名的CuteEditor和CKEditor很多人应该已经使用过,在功能强大的同时需要加载的东西也变得很多.下面要推荐的两款富文本编辑器都是使用JS编写 ...
- Oracle之Linux下核心参数
kernel.shmmax 用于定义单个共享内存段的最大值: 建议一个大的共享内存段能容纳整个SGA,这样在任何时候都不会有性能下降的隐患: 建议:32位Linux 物理内存大于4G 的设置为4G 即 ...
- python 装饰器(decorator)
装饰器(decorator) 作者:Vamei 出处:http://www.cnblogs.com/vamei 欢迎转载,也请保留这段声明.谢谢! 装饰器(decorator)是一种高级Python语 ...
- iPhone图标及启动画面大小 xcode5
启动画面 文件名 大小px Default.png 320*480 Default@2x.png 640*960 Default-568h@2x.png 640*1136 图标 文件名 大小px ...
- 在Ubuntu下设置环境变量
在Ubuntu中有如下几个文件可以设置环境变量 /etc/profile:在登录时,操作系统定制用户环境时使用的第一个文件,此文件为系统的每个用户设置环境信息,当用户第一次登录时,该文件被执行. /e ...
- ios第三方分享到qq、微信、人人网、微博总结
我们开发出来的APP通常要通过第三方分享到其他社交平台,如qq.微博微信 等.通过分享可以提高APP的传播效率,增加APP的曝光率,因此也算是APP功能 里的标配了吧.目前常用的第三方分享途径有qq. ...
- SQL基础学习篇--字符函数
字符函数可与SELECT,UPDATE,DELETE RIGHT()----从右侧开始选择 SELECT RIGHT(列,字符数量) FROM 表 LEFT()----从左侧开始选择 SUBSTR ...
- 创建表 添加主键 添加列常用SQL语句
--删除主键 alter table 表名 drop constraint 主键名--添加主键alter table 表名 add constraint 主键名 primary key(字段名1,字段 ...
- java中的排序
排序是数据结构中重要的一个部分,也是在实际开发中最易遇到的问题之一,当然了,你也可以不考虑这些排序的算法,直接把要排序的数据insert到数据库中,用数据库的order by再select一下,也能产 ...