Python 爬取12306火车票

获取火车站

stations.py

#import certifi

#import urllib3

import re

import requests

from pprint import pprint

url = 'https://kyfw.12306.cn/otn/resources/js/framework/station_name.js?station_version=1.9001'

response = requests.get(url, verify=False)

stations = re.findall('([\u4e00-\u9fa5]+)\|([A-Z]+)',response.text)

print(dict(stations))

#pprint(dict(stations),indent=4)

根据出发地,目的地,时间查询

#!/usr/bin/env python

#coding:utf-8

"""命令行的火车票查看器

Usage:

    12306 [-gdtkz] <from> <to> <date>

Options:

    -h,--help  显示帮助

    -g           高铁

    -d         动车

    -t         特快

    -k         快速

    -z         直达

Example:

    12306 上海 北京 2016-12-16

    12306 -dg 上海北京 2016-12-16

pip install requests prettytable docopt colorama

#prettytable格式化工具

#docopt是python3命令行的位置参数解析工具

#colorama是添加显示颜色

"""

import requests

from docopt import docopt

import sys

#sys.path.append(r"/py/stations")

from stations import stations

import json

from prettytable import PrettyTable

class TrainsCollections:

    header = '车次 车站 时间 历时 一等 二等 软卧 硬卧 硬座 无座'.split()

    def __init__(self,available_tranins,options):

        self.available_tranins = available_tranins

        self.options = options

    def _get_duration(self,raw_train):

        durations = raw_train.get('lishi').replace(':','小时') + '分'

        return durations

    #装饰器,把此函数定义为属性,以被别的函数调用

    @property

    def trains(self):

        for raw_train in self.available_tranins:

            train_no = raw_train['station_train_code']

            initial = train_no[0].lower()

            if not self.options or initial  in self.options:

                train = [

                train_no,

                '\n'.join([raw_train['from_station_name'],raw_train['to_station_name']]),

                '\n'.join([raw_train['start_time'],raw_train['arrive_time']]),

                self._get_duration(raw_train),

                raw_train['zy_num'],

                raw_train['ze_num'],

                raw_train['rw_num'],

                raw_train['yw_num'],

                raw_train['yz_num'],

                raw_train['wz_num'],

                ]

                #print(train)

                #生成器,一次返回一项

                yield train

    def pretty_print(self):

        pt = PrettyTable()

        pt._set_field_names(self.header)

        for train in self.trains:

            pt.add_row(train)

            print(pt)

def cli():

    '''

    {

    '-d':True,

    '-g':True,

    '-k':False,

    '-t':False,

    '-z':False,

    '<date>':'2017-03-23',

    '<from>':'海口',

    '<to>':'北京'}

    '''

    arguments = docopt(__doc__)

    print(arguments)

    from_station = stations.get(arguments['<from>'])

    to_station = stations.get(arguments['<to>'])

    date = arguments['<date>']

    #获取参数,列表解析

    options = ''.join([k for k,v in arguments.items() if v is True])

    url = 'https://kyfw.12306.cn/otn/leftTicket/query?leftTicketDTO.train_date={}&leftTicketDTO.from_station={}&leftTicketDTO.to_station={}&purpose_codes=ADULT'.format(date,from_station,to_station)

    #url = 'https://kyfw.12306.cn/otn/leftTicket/query?leftTicketDTO.train_date={}&leftTicketDTO.from_station={}&leftTicketDTO.to_station={}&purpose_codes=ADULT'

    r = requests.get(url,verify=False)

    print(url)

    #jjj = json.loads(str(r))

    available_tranins1 = r.json()['data']

    available_tranins = []

    for available_tranins2 in available_tranins1:

       available_tranins.append(available_tranins2['queryLeftNewDTO'])

        #available_tranins = list(available_tranins.keys())

       # print(available_tranins)

        #TrainsCollections(available_tranins,options).pretty_print()

    #available_tranins = available_tranins2['queryLeftNewDTO']

    #print(available_tranins)

    #print(type(available_tranins[0]))

    TrainsCollections(available_tranins,options).pretty_print()

if __name__ == '__main__':

    #TrainsCollections.cli()

    cli()

Python 爬取12306火车票的更多相关文章

python爬取12306及各参数的使用。完整代码
import requestsfrom retrying import retryreuquests和retrying的下载及安装可以通过命令行pip install 口令实现 # 调用重连装饰器固定 ...
Python 爬取所有51VOA网站的Learn a words文本及mp3音频
Python 爬取所有51VOA网站的Learn a words文本及mp3音频 #!/usr/bin/env python # -*- coding: utf-8 -*- #Python 爬取所有5 ...
python爬取网站数据
开学前接了一个任务,内容是从网上爬取特定属性的数据.正好之前学了python,练练手. 编码问题因为涉及到中文,所以必然地涉及到了编码的问题,这一次借这个机会算是彻底搞清楚了. 问题要从文字的编码讲 ...
python爬取某个网页的图片-如百度贴吧
python爬取某个网页的图片-如百度贴吧作者:vpoet mail:vpoet_sir@163.com 注:随意copy,不用告诉我 #coding:utf-8 import urllib imp ...
Python:爬取乌云厂商列表，使用BeautifulSoup解析
在SSS论坛看到有人写的Python爬取乌云厂商,想练一下手,就照着重新写了一遍原帖:http://bbs.sssie.com/thread-965-1-1.html #coding:utf- im ...
使用python爬取MedSci上的期刊信息
使用python爬取medsci上的期刊信息,通过设定条件,然后获取相应的期刊的的影响因子排名,期刊名称,英文全称和影响因子.主要过程如下: 首先,通过分析网站http://www.medsci.cn ...
python爬取免费优质IP归属地查询接口
python爬取免费优质IP归属地查询接口具体不表,我今天要做的工作就是: 需要将数据库中大量ip查询出起归属地刚开始感觉好简单啊,毕竟只需要从百度找个免费接口然后来个python脚本跑一晚上就o ...
Python爬取豆瓣指定书籍的短评
Python爬取豆瓣指定书籍的短评 #!/usr/bin/python # coding=utf-8 import re import sys import time import random im ...
python爬取网页的通用代码框架
python爬取网页的通用代码框架: def getHTMLText(url):#参数code缺省值为‘utf-8’(编码方式) try: r=requests.get(url,timeout=30) ...

随机推荐

php时间时间戳
/* *+ ------------------------------- * 计算当天起始点和结束点时间戳取出当天的数据 *+ ------------------------------ */ ...
apue 第18章终端I/O
终端I/O有两种不同的工作模式: (1)规范模式:输入以行单位进行处理,每个读请求也最多返回一行. (2)非规范模式:输入字符不装配成行. 终端设备是由通常位于内核中的终端驱动程序控制的.每个终端设备 ...
EXCEL设置三级下拉框
EXCEL设置三级下拉框 1.添加下拉框数据源公式--->指定公式--->名称管理器 2.设置第一级下拉框的值 3.第一级下拉框选出一个值 4.设置第二级下拉框(INDIRECT($A ...
SCP-bzoj-1068
项目编号:bzoj-1068 项目等级:Safe 项目描述: 戳这里特殊收容措施: 区间DP.f[l][r][s]表示l到r的子串能最小被压成的长度,其中s∈[0,1]表示该串压缩后串中是否能含有M ...
概率——17icpc西安
不知道为什么是这样子的.. #include<bits/stdc++.h> using namespace std; int m,n; int main(){ while(scanf(&q ...
Shell4
ssh 192.168.4.5>提示continue,连接过的主机不会提示>连接过的主机文件存放位置:/root/.ssh/known_hosts ################### ...
AngularJS 指令实践指南（一）
指令(Directives)是所有AngularJS应用最重要的部分.尽管AngularJS已经提供了非常丰富的指令,但还是经常需要创建应用特定的指令.这篇教程会为你讲述如何自定义指令,以及介绍如何在 ...
es6学习笔记--箭头函数
基本用法 ES6允许使用“箭头”(=>)定义函数. var f = v => v; 上面的箭头函数等同于: var f = function(v) { return v; }; 如果箭头函 ...
带头节点的单链表-------C语言实现
/***************************************************** Author:Simon_Kly Version:0.1 Date:20170520 De ...
checkbox、radio使用jquery改变状态以及其他操作
$('input[type=checkbox]:checked').each(function(index,elem){ $(elem).attr("checked",false) ...

Python 爬取12306火车票

Python 爬取12306火车票的更多相关文章

随机推荐

热门专题