python爬虫之12306网站--车站信息查询

python爬虫查询车站信息

1.找到要查询的url

2.对信息进行分析

3.对信息进行处理

python爬虫查询全拼相同的车站

1.找到要查询的url

2.对信息进行分析

3.对信息进行处理

1.找到车站信息的url

2.分析车站信息，发现每个车站信息以"@"分隔

车站信息查询

#车站信息查询

import requests

#1.获得url(存取车站信息的url)并读取，根据获得信息的特点去掉无用的信息并转换存储到列表中

url="https://kyfw.12306.cn/otn/resources/js/framework/station_name.js?station_version=1.9090"

txt=requests.get(url).text

#print(txt)

inf=txt[:-2].split("@")[1:] #得到的是存储所有车站信息的列表

#print(inf)

#2.通过循环把列表在进行分割转换成新的列表,取其中一项(车站顺序编号)当做字典的key,其余当作值，存储到新的字典中

stations={}

for record in inf:

    rlist=record.split("|")

    stations[int(rlist[-1])]={"cname":rlist[1],"id":rlist[2],"qp":rlist[3],"jx":rlist[4]}

#print(stations[0])

#print(stations.get(2848))

#print(stations.values())

#3.判断查询条件是否存在，存在如果唯一则打印并跳出循环，不唯一则显示查询的所有的结果，提供选择,根据选择的信息打印出结果然后跳出循环，不存在则打印提示信息,重新输出

while True:

    s1=input("出发站:")

    flag=0

    result=[]

    for station in stations.values():

        if s1 in station.values():

            #print(station)

            result.append(station)

            flag=1

    if flag:

        break

    else:

        print("没有这个车站!")

        print("请重新输入!")

if len(result)==1:

    resultId=result[0]["id"]

    print("你输入的出发车站是%s,对应的车站ID是%s"%(result[0]["cname"],resultId))

else:

    print("你输入的条件比较模糊,请在以下站中进行选择:")

    for i in range(len(result)):

        print(i+1,result[i]["cname"],result[i]["id"])

    sel=int(input("你的选择:"))-1

    resultId=result[sel]["id"]

    print("你输入的出发车站是%s,对应的车站ID是%s"%(result[sel]["cname"],resultId))

while True:

    s2=input("目的站:")

    flag2=0

    result2=[]

    for station in stations.values():

        if s2 in station.values():

            #print(station)

            result2.append(station)

            flag2=1

    if flag2:

        break

    else:

        print("没有这个车站!")

        print("请重新输入!")

if len(result2)==1:

    result2Id=result2[0]["id"]

    print("你输入的目的车站是%s,对应的车站ID是%s"%(result2[0]["cname"],result2Id))

else:

    print("你输入的条件比较模糊,请在以下站中进行选择:")

    for i in range(len(result2)):

        print(i+1,result2[i]["cname"],result2[i]["id"])

    sel2=int(input("你的选择:"))-1

    result2Id=result2[sel2]["id"]

    print("你输入的目的车站是%s,对应的车站ID是%s"%(result2[sel]["cname"],result2Id))

#生成一条带查询的url(url在浏览器开发者模式查找)

qurl="https://kyfw.12306.cn/otn/leftTicket/queryZ?leftTicketDTO.train_date=2019-01-14&leftTicketDTO.from_station=%s&leftTicketDTO.to_station=%s&purpose_codes=ADULT"

print(qurl %(resultId,result2Id))

运行效果如下:

2.查询出所有全拼相同的所有车站名称

#python 查询出所有全拼相同的所有车站名称

import requests

url="https://kyfw.12306.cn/otn/resources/js/framework/station_name.js?station_version=1.9090"

txt=requests.get(url).text

inf=txt[:-2].split("@")[1:]

stations={}

for record in inf:

    rlist=record.split("|")

    stations[int(rlist[-1])]={"cname":rlist[1],"id":rlist[2],"qp":rlist[3],"jx":rlist[4]}

pyin=[]

for station in stations.values():       #把获得的信息所有的"qp"所对应的值全部放到列表中(pyin)

        pyin.append(station["qp"])

npy=list(set(pyin))     #利用集合的去重特性对列表进行去掉重复项

npy.sort()      #对列表进行排序

c={}

for station in stations.values():       #分别把所有的全拼当作键，值加入到新的字典当中

    c[station["qp"]]=c.get(station["qp"],0)+1

#print(c)

c2=[]

for k,v in c.items():   #判断字典的值是否大于1，大于则说明存在全拼相同的车站名

    if v>1:

        c2.append(k)    #把满足条件的所有的全拼加入到新的列表中

c2.sort()

#print(c2)

for p in c2:            #遍历列表，打印出符合条件的车站

    print(p,end=":")

    for station in stations.values():

        if p==station["qp"]:

            print(station["cname"])

运行效果如下：

python爬虫之12306网站--车站信息查询的更多相关文章

python爬虫之12306网站--火车票信息查询
python爬虫之12306网站--火车票信息查询思路: 1.火车票信息查询是基于车站信息查询,先完成车站信息查询,然后根据车站信息查询生成的url地址去查询当前已知出发站和目的站的所有车次车票信息 ...
python爬虫之天气预报网站--查看最近(15天)的天气信息(正则表达式)
python爬虫之天气预报网站--查看最近(15天)的天气信息(正则表达式) 思路: 1.首先找到一个自己想要查看天气预报的网站,选择自己想查看的地方,查看天气(例:http://www.tianqi ...
python+splinter实现12306网站刷票并自动购票流程
python+splinter实现12306网站刷票并自动购票流程通过python+splinter,实现在12306网站刷票并自动购票流程(无法自动识别验证码). 此类程序只是提高了12306网站 ...
python爬虫抓取哈尔滨天气信息（静态爬虫）
python 爬虫爬取哈尔滨天气信息 - http://www.weather.com.cn/weather/101050101.shtml 环境: windows7 python3.4(pip i ...
python爬虫之小说网站--下载小说(正则表达式)
python爬虫之小说网站--下载小说(正则表达式) 思路: 1.找到要下载的小说首页,打开网页源代码进行分析(例:https://www.kanunu8.com/files/old/2011/244 ...
Python爬虫某招聘网站的岗位信息
前言文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者:阿尔法游戏 PS:如有需要Python学习资料的小伙伴可以加点击下方链 ...
简单的python爬虫--爬取Taobao淘女郎信息
最近在学Python的爬虫,顺便就练习了一下爬取淘宝上的淘女郎信息:手法简单,由于淘宝网站本上做了很多的防爬措施,应此效果不太好! 爬虫的入口:https://mm.taobao.com/json/r ...
python爬虫1——获取网站源代码(豆瓣图书top250信息)
# -*- coding: utf-8 -*- import requests import re import sys reload(sys) sys.setdefaultencoding('utf ...
python爬虫--模拟12306登录
模拟12306登录超级鹰: #!/usr/bin/env python # coding:utf-8 import requests from hashlib import md5 class Ch ...

随机推荐

开始翻译Disruptor
刚开始接触Disruptor,看了作者的博客,发现这个大牛很与众不同,他不仅讲解自己的框架的设计思想,还深度介绍了这样设计的原因,其知识范围涵盖了操作系统.数据结构.计算机组成,很有学习的价值.网上有 ...
RabbitMQ系列（二）深入了解RabbitMQ工作原理及简单使用
深入了解RabbitMQ工作原理及简单使用 RabbitMQ系列文章 RabbitMQ在Ubuntu上的环境搭建深入了解RabbitMQ工作原理及简单使用 RabbitMQ交换器Exchange介绍 ...
Perl函数：字符串相关函数
Perl字符串相关函数字符串的内置函数有: chomp, chop, chr, crypt, fc, hex, index, lc, lcfirst, length, oct, ord, pack, ...
基于SpringMVC+Spring+MyBatis实现秒杀系统【客户端交互】
前言该篇主要实现客户端和服务的交互.在第一篇概况里我已经贴出了业务场景的交互图片. 客户端交互主要放在seckill.js里来实现.页面展现基于jsp+jstl来实现. 准备工作 1.配置web.x ...
以 SPI 方式获取 SD 卡容量（V2.0）
下面是 SD 卡 V2.0 协议的 CSD 寄存器内容,来自官方手册: 单片机如何确定当前的 SD 卡遵循 V2.0 协议 CSD 寄存器为 128 个位,即 16 个字节.通过检测 CSD 寄存器的 ...
【转】JQuery上传插件Uploadify使用详解及错误处理
转自:http://www.jb51.net/article/43498.htm 关于JQuery上传插件Uploadify使用详解网上一大把,基本上内容都一样.我根据网上的步骤配置完成后,会报一些错 ...
JQuery ajax的使用
JQuery 真的是好东西 $.ajax({ type: "post", url: "/DataCheck", ...
解决命名空间“System.Web.Mvc”中不存在类型或命名空间名称“Ajax”(是否缺少程序集引用?)
解决命名空间“System.Web.Mvc”中不存在类型或命名空间名称“Ajax”(是否缺少程序集引用?) 1.右击引用中的System.Web.MVC,点击“属性” 把"复制本地" ...
SVN服务器本地搭建与使用
转载请注明原文地址:http://www.cnblogs.com/ygj0930/p/6623026.html 使用SVN进行代码管理,需要搭建服务端资源库,然后在使用SVN的电脑安装SVN客户端或 ...
[nodejs] nodejs开发个人博客（五）分配数据
使用回掉大坑进行取数据能看明白的就看,看不明白的手动滑稽 /** * 首页控制器 */ var router=express.Router(); /*每页条数*/ var pageSize=5; r ...

python爬虫之12306网站--车站信息查询

python爬虫之12306网站--车站信息查询的更多相关文章

随机推荐

热门专题