用Python获取沪深两市上市公司股票信息，提取创近10天股价新高的、停牌的、复牌不超过一天或者新发行的股票，并存入mysql数据库

 #该脚本可以提取沪深两市上市公司股票信息，并按以下信息分类：（1）当天股价创近10个交易日新高的股票；（2）停牌的股票；（3）复牌不超过一个交易日或者新发行的股票

 #将分类后的股票及其信息（股价新高、当前状态等）存入mysql数据库

 from time import *

 import pandas as pd

 import tushare as ts

 from datetime import date

 import datetime

 import MySQLdb

 import sys

 reload(sys)

 sys.setdefaultencoding('utf8')        #将编码方式默认改为utf-8

 #-------------------------------定义函数：计算当天往前推Deltadays个交易日所对应的日期--------------------------

 def com_StartDate(Deltadays):

     i=0

     da=date.today()

     while i!=Deltadays:

         da=da-datetime.timedelta(days=1)

         if da.isoweekday()==6 or da.isoweekday()==7:   #判断当前日期是否为周末（此处未考虑法定节假日，后续改进）

             pass

         else:

             i+=1

     return da.strftime("%Y-%m-%d")   #返回值数据类型为string

 #--------------定义函数：判断某支股票处于什么状态，并返回股票代码、名字和股价（对于创新高的股票）等信息--------

 def stock_info(stockID,startdate,index):

     today=date.today()

     df=ts.get_hist_data(stockID,start=startdate,end=today.strftime("%Y-%m-%d")) #获取股票信息

     if type(df)!=type(None) and len(df.index)>1:                       #抓取时间周期内，有数据天数低于2天的，算作新股

         df=df.reindex(index=index,method='ffill',fill_value=int(-1))

         period_high=df['high'].max()

         today_high=df.ix[today.strftime("%Y-%m-%d")]['high']

         if today_high>=period_high and today_high>0 :

             stock_status=int(0)         #非新股，未停牌，股价创新高

             return stock_status,df

         elif today_high==int(-1):

             stock_status=int(1)        #非新股，但停牌

             return stock_status,df

         else:

             stock_status=int(2)       #非新股，未停牌，股价未创新高

             return stock_status,df

     else:

         stock_status=int(3)           #新股或复牌不超过1天的股票

         return stock_status,df

 #-----------------------------------------------获取沪深两市所有 上市公司基本信息---------------------------

 all_stocks_info=ts.get_stock_basics()

 Deltadays=10

 startdate=com_StartDate(Deltadays)

 newRecStocksID=[]                    #股票价格创新高的股票代码列表

 newRecStocksPrice=[]                 #创新高的股票价格列表

 newRecStocksName=[]                  #股票价格创新高的股票名称列表

 suspendedStocksID=[]                #停牌股票代码列表

 suspendedStocksName=[]              #停牌股票名称列表

 newORresumeStocksID=[]                      #新发行或者当天复牌的股票代码列表

 newORresumeStocksName=[]                    #新发行或者当天复牌的股票名称列表

 today=date.today()

 index=ts.get_hist_data('',start=startdate,end=today.strftime("%Y-%m-%d"),retry_count=10,pause=1).index

 for i in all_stocks_info.index:

     stock_status,stockinfo=stock_info(str(i), startdate,index)

     if  stock_status==int(0):                                #当日股价创Deltadays天内新高的股票

         newRecStocksID.append(str(i).zfill(6))

         newRecStocksName.append(all_stocks_info.ix[str(i),'name'])

         newRecStocksPrice.append(stockinfo.ix[today.strftime("%Y-%m-%d"),'high'])

     elif stock_status==int(1):                              #已停牌的股票

         suspendedStocksID.append(str(i).zfill(6))

         suspendedStocksName.append(all_stocks_info.ix[str(i), 'name'])

     elif stock_status==int(2):                             #未停牌，且股价未创Deltadays天内新高的股票

         pass

     else:                                                  #该股票为新发行或者复牌不超过一天的股票

         newORresumeStocksID.append(str(i).zfill(6))

         newORresumeStocksName.append(all_stocks_info.ix[str(i), 'name'])

 #-------------------------------------------数据写入DataFrame----------------------------------------------

 newRecStocks=pd.DataFrame({'stockID':newRecStocksID,'stockname':newRecStocksName,'high_price':newRecStocksPrice,'status':['NewRecord']*len(newRecStocksID)})

 suspendedStocks=pd.DataFrame({'stockID':suspendedStocksID,'stockname':suspendedStocksName,'status':['Suspended']*len(suspendedStocksID)})

 newORresumeStocks=pd.DataFrame({'stockID':newORresumeStocksID,'stockname':newORresumeStocksName,'status':['New or Resume']*len(newORresumeStocksID)})

 #-----------------------------------将数据存入MySQL数据库，数据库名称：stocks------------------------------

 db=MySQLdb.connect('localhost','root','','stocks',charset='utf8')

 pd.io.sql.to_sql(frame=newRecStocks,con=db,name=today.strftime("%Y%m%d")+'newRecordStocks',flavor='mysql',schema=None,if_exists='replace',index=True,index_label=None,chunksize=1000,dtype=None)

 pd.io.sql.to_sql(frame=suspendedStocks,con=db,name=today.strftime("%Y%m%d")+'suspendedStocks',flavor='mysql',schema=None,if_exists='replace',index=True,index_label=None,chunksize=1000,dtype=None)

 pd.io.sql.to_sql(frame=newORresumeStocks,con=db,name=today.strftime("%Y%m%d")+'newORresumeStocks',flavor='mysql',schema=None,if_exists='replace',index=True,index_label=None,chunksize=1000,dtype=None)

 db.commit()

 db.close()

用Python获取沪深两市上市公司股票信息，提取创近10天股价新高的、停牌的、复牌不超过一天或者新发行的股票，并存入mysql数据库的更多相关文章

Python+Scrapy+Crawlspider 爬取数据且存入MySQL数据库
1.Scrapy使用流程 1-1.使用Terminal终端创建工程,输入指令:scrapy startproject ProName 1-2.进入工程目录:cd ProName 1-3.创建爬虫文件( ...
python爬虫学习(2)__抓取糗百段子，与存入mysql数据库
import pymysql import requests from bs4 import BeautifulSoup#pymysql链接数据库 conn=pymysql.connect(host= ...
python爬取疫情数据存入MySQL数据库
import requests from bs4 import BeautifulSoup import json import time from pymysql import * def mes( ...
Statement和PreparedStatement的特点 MySQL数据库分页存取大对象批处理获取数据库主键值
1 Statement和PreparedStatement的特点 a)对于创建和删除表或数据库,我们可以使用executeUpdate(),该方法返回0,表示未影向表中任何记录 b)对于创建和 ...
python爬虫：爬取易迅网价格信息，并写入Mysql数据库
本程序涉及以下方面知识: 1.python链接mysql数据库:http://www.cnblogs.com/miranda-tang/p/5523431.html 2.爬取中文网站以及各种乱码处 ...
Python爬虫教程-25-数据提取-BeautifulSoup4（三）
Python爬虫教程-25-数据提取-BeautifulSoup4(三) 本篇介绍 BeautifulSoup 中的 css 选择器 css 选择器使用 soup.select 返回一个列表通过标 ...
Python爬虫教程-23-数据提取-BeautifulSoup4（一）
Beautiful Soup是python的一个库,最主要的功能是从网页抓取数据,查看文档 https://www.crummy.com/software/BeautifulSoup/bs4/doc. ...
Python 获取 exe 的 icon 并且保存
Python 获取 exe 的 icon 并且保存参考链接:https://mail.python.org/pipermail/python-win32/2009-April/009078.html ...
使用shell/python获取hostname/fqdn释疑
一直以来被Linux的hostname和fqdn(Fully Qualified Domain Name)困惑了好久,今天专门抽时间把它们的使用细节弄清了. 一.设置hostname/fqdn 在Li ...

随机推荐

javascript原型prototype浅识
C++,java是基于类的语言,主要通过类来实现继承. javascript是基于原型的语言,通过原型来实现继承. 什么是原型?每种物质,都可以追根溯源,原型就是对象的根源.继承就是追根溯源. jav ...
理解HTTP和HTTPS的区别
原问转载于https://www.mysubmail.com/chs/blog/view/47 这两天闲来无事,在网上看了一下,发现 HTTP 和 HTTPS 的区别很受关注,多位大牛做了很详细的阐述 ...
结合个人经历总结的前端入门方法 (转自https://github.com/qiu-deqing/FE-learning)
结合个人经历总结的前端入门方法 (https://github.com/qiu-deqing/FE-learning),里面有很详细的介绍. 之前一直想学习前端的,都不知道怎么下手都一年了啥也没学到, ...
[sqoop1.99.7] sqoop命令
官网文档:http://sqoop.apache.org/docs/1.99.7/user/CommandLineClient.html#delete-link-function 一.了解sqoop数 ...
wmware 怎么跟主机相互通信
VMnet1和VMware8其实就是软件模拟出来的两块网卡提供DHCP服务,两块网卡对应VMware的两种不同的模式VMWare提供了三种工作模式,它们是bridged(桥接模式).NAT(网络地址转 ...
个人学习随笔（psi-blast随笔）
psi-blast学习最近自己学习了一些新工具,最近在学习关于蛋白质相互作用位点的预测,在学习中,接触了几个新的工具,下面说说自己正在学习的psi-blast. 首先要说我用psi-blast用来做 ...
.NET 框架程序使用 Win32 API
.NET 框架程序可以通过静态 DLL 入口点的方式来访问本机代码库.DllImport 属性用于指定包含外部方法的实现的dll 位置. DllImport 属性定义如下: na ...
ASP.NET 教程(一)
ASP.NET 是一个开发框架,用于通过 HTML.CSS.JavaScript 以及服务器脚本来构建网页和网站. ASP.NET 支持三种开发模式: Web Pages.MVC (Model Vie ...
UIKit - scrollView缩放、滚动
UIScrollView滚动三大属性: self.scrollView.pageEnabled = NO 是否分页:n只要将UIScrollView的pageEnabled属性设置为YES,UIS ...
QT-4.8.6 编译配置过程
1.编译 TSLib sudo apt-get install automake autogen libtool libtool-bin./autogen.sh./configure --host=a ...

用Python获取沪深两市上市公司股票信息，提取创近10天股价新高的、停牌的、复牌不超过一天或者新发行的股票，并存入mysql数据库

用Python获取沪深两市上市公司股票信息，提取创近10天股价新高的、停牌的、复牌不超过一天或者新发行的股票，并存入mysql数据库的更多相关文章

随机推荐

热门专题