KFC 小猪短租

# 分析肯德基门店信息

import requests,json

post_url = 'http://www.kfc.com.cn/kfccda/ashx/GetStoreList.ashx?op=cname'

headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.81 Safari/537.36'}

all_data = []

IDs =[]

cname = input('输入城市名: ')

# for page in range(1,10):

data = {

    "cname": cname,

    "pid": "",

    "pageIndex": "",

    "pageSize": "",

}

json_obj = requests.post(url=post_url,data=data,headers=headers).json()

num = json_obj['Table'][0]['rowcount']  # 餐厅总数  int

print("餐厅总数",num)

小贴士: 运行后,输入城市或省份地址,得到肯德基门店数量

# 小猪短租

from bs4 import BeautifulSoup

import requests

import time

headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.81 Safari/537.36'}

def judgment_sex(class_name):

    if class_name == ['member_ico1']:

        return '女'

    else:

        return '男'

def get_links(url):

    wb_data = requests.get(url, headers= headers)

    soup = BeautifulSoup( wb_data. text,'lxml')

    links = soup. select('#page_list > ul > li > a')

    for link in links:

        href = link. get("href")

        get_info(href)

def get_info(url):

    wb_data = requests.get( url, headers= headers)

    soup = BeautifulSoup( wb_data.text,'lxml')

    tittles = soup. select('div.pho_info > h4')

    addresses = soup.select('span.pr5')

    prices = soup.select('#pricePart > div.day_l > span')

    imgs = soup.select('#floatRightBox > div.js_box.clearfix > div.member_pic > a > img')

    names = soup.select('#floatRightBox > div.js_box.clearfix > div.w_240 > h6 > a')

    sexs = soup.select('#floatRightBox > div.js_box.clearfix > div.member_pic > div')

    for tittle, address, price, img, name, sex in zip( tittles, addresses, prices, imgs, names, sexs):

        data = { 'tittle': tittle.get_text().strip(),

                 'address': address.get_text().strip(),

                 'price': price.get_text(),

                 'img': img.get("src"),

                 'name': name.get_text(),

                 'sex': judgment_sex(sex.get("class"))}

        print(data)

if __name__ == '__main__':

    urls = ['http://ty.xiaozhu.com/search-duanzufang-p{}-0/'.format(number) for number in range(1,14)]

    for single_url in urls:

        get_links(single_url)

        time.sleep(0.3)

# 酷狗500歌曲

from bs4 import BeautifulSoup

import requests

import time

headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.81 Safari/537.36'}

def judgment_sex(class_name):

    if class_name == ['member_ico1']:

        return '女'

    else:

        return '男'

def get_info(url):

    wb_data = requests.get( url, headers= headers)

    soup = BeautifulSoup( wb_data.text,'lxml')

    ranks = soup.select('span.pc_temp_num')

    titles = soup.select('div.pc_temp_songlist > ul > li > a')

    times = soup.select(' span.pc_temp_tips_r > span')

    for rank,title,time in zip(ranks,titles,times):

        data = { 'rank': rank.get_text().strip(),

                 'singer': title.get_text().split('-')[0],

                 'song': title.get_text().split('-')[1],

                 'time': time.get_text().strip()}

        print(data)

if __name__ == '__main__':

    urls = ['http://www.kugou.com/yy/rank/home/{}-8888.html'.format(number) for number in range(1,24)]

    for single_url in urls:

        get_info(single_url)

        time.sleep(0.3)

酷狗500

import re

a = 'xxIxxjshdxxlovexxsffaxxpythonxx'

infos = re.findall('xx(.*?)xx',a,re.S)

print(infos)

# ['I', 'love', 'python']

re 一个

import re

phone = '''

123．-4，567,1234,jdd,cdc.23,the

wfewf ,fer3t

'''

new_phone = re.sub("\d+",' ', phone)

aa = re.sub('\W+',' ',new_phone)

print(aa)

re匹配数字标点符号

KFC 小猪短租的更多相关文章

python3通过Beautif和XPath分别爬取“小猪短租-北京”租房信息，并对比时间效率（附源代码）
爬虫思路分析: 1. 观察小猪短租(北京)的网页首页:http://www.xiaozhu.com/?utm_source=baidu&utm_medium=cpc&utm_term ...
短租app简析
本人应聘某短租app产品经理时做的材料,贴出来请高手指教. 所有内容来自公开资料,不涉及商业秘密.
Python爬虫：设置Cookie解决网站拦截并爬取蚂蚁短租
前言文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者: Eastmount PS:如有需要Python学习资料的小伙伴可以加 ...
看完你也能独立负责项目！产品经理做APP从头到尾的所有工作流程详解！
(一)项目启动前从事产品的工作一年多,但自己一直苦于这样或者那样的困惑,很多人想要从事产品,或者老板自己创业要亲自承担产品一职,但他们对产品这个岗位的认识却不明晰,有的以为是纯粹的画原型,有的是以为 ...
爬虫系列3：Requests+Xpath 爬取租房网站信息并保存本地
数据保存本地 [抓取]:参考前文爬虫系列1:https://www.cnblogs.com/yizhiamumu/p/9451093.html [分页]:参考前文爬虫系列2:https://www ...
新加坡金融科技节 | 蚂蚁金服CTO程立：面向全球开放，与合作伙伴共赢
小蚂蚁说: 11月13日,在新加坡金融科技节上,蚂蚁金服CTO程立分别从TechFin.BASIC战略.SOFAStack全栈分布式体系以及全面开放等方面讲述蚂蚁金融科技. TechFin是一种“倒立 ...
@1-4使用Xpath解析豆瓣短评
使用Xpath解析豆瓣短评 Python爬虫(入门+进阶) DC学院本节课程主要介绍解析神器Xpath是什么.Xpath如何安装及使用,以及使用实际的例子讲解Xpath如何解析豆瓣短评的网页 ...
数据分析侠A的成长故事
数据分析侠A的成长故事面包君同学A:22岁,男,大四准备实习,计算机专业,迷茫期作为一个很普通的即将迈入职场的他来说,看到周边的同学都找了技术开发的岗位,顿觉自己很迷茫,因为自己不是那么喜欢钻 ...
python3爬取咪咕音乐榜信息（附源代码）
参照上一篇爬虫小猪短租的思路https://www.cnblogs.com/aby321/p/9946831.html,继续熟悉基础爬虫方法,本次爬取的是咪咕音乐的排名咪咕音乐榜首页http://m ...

随机推荐

番外：你真的了解 Oracle 的启动流程吗？
番外系列说明:该系列所有文章都将作为独立篇章进行知识点讲解,是对其他系列博文进行的补充说明,来自于博客园AskScuti. 主题:关于数据库启动流程的三个阶段内容预览:本篇涉及数据库启动的三个阶段分 ...
python+selenium自动化禅道登录测试
本文以禅道登录测试为例,思路主要分openBrowser.openUrl.findElement.sendVals.checkResult.ReadUserdate六部分 openBrowser de ...
ECMAScript基本语法——⑤运算符一元运算符
++自增在前先自增,再运算在后先运算,再自增 --自减在前先自减,再运算在后先运算,再自减 +正号,-负号.表示数字的正负注意:在JavaScript中,如果运算数不是运算符要求的类型, 那 ...
如何在本地远程连接linux虚拟机上面的mysql
基础环境: 在linux安装mysql 检查远程的虚拟机是否可以ping通过查看虚拟机IP为192.168.38.128 cmd窗口ping 192.168.38.128,出现如下界面说明是可以的 ...
字符串匹配算法--暴力匹配(Brute-Force-Match)C语言实现
一.前言暴力匹配(Brute-Force-Match)是字符串匹配算法里最基础的算法,虽然效率比较低,但胜在方便理解,在小规模数据或对时间无严格要求的情况下可以考虑. 二.代码 #include & ...
sql查询 —— 分组
-- 分组 -- group by -- 分组只有与聚合函数一起使用才能发挥作用 -- 分组只限于字段分明例如性别 ,部门, --列出所有性别 select gender from student ...
centOS7中启动MySQL数据库提示： Failed to start mysqld.service: Unit not foundc
现象: 在centOS7中启动MySQL数据库提示: Failed to start mysqld.service: Unit not found [明明已经安装了,为什么提示不存在呢?] 原因: 在 ...
C++-POJ1015-Jury Compromise
Java实现会MLE那我也没办法了 //辩方总分和控方总分之差简称为“辩控差” //辩方总分和控方总分之和简称为“辩控和” //现用f(j, k)表示,取j 个候选人,使其辩控差为k 的所有方案中,辩 ...
AcWing 125. 耍杂技的牛
//按照wi+si从小到大的顺序排,结果一定最优,最大的危险系数一定是最小的 //类比于国王游戏 #include <iostream> #include <algorithm> ...
k8s集群问题记录
k8s集群问题记录 k8s学习方案问题解决思路主要学习路径: rancher(k8s)->rke->helm->kubectl->k8s(k8s中文api) 常见问题总结: ...

KFC 小猪短租

KFC 小猪短租的更多相关文章

随机推荐

热门专题