Day 07 字符串内置方法和爬虫基础3
异常处理
try:
print(1/0) # 有错误就跳过,没错误就执行
except ZeroDivisionError: # 错误被捕捉
pass # 什么也不做
try:
key = input('请输入一个key来获取相应的值')
dic = {'a': 1}
dic[key] # KeyError
except Exception as e: # Exception万能异常 把错误信息输出,同时一般把错误记录到日志中
logging.info(e) # 给程序员看
print('请输入正确的key') # 给用户看
# 预运行(类似把代码抽离到另外一个文件中运行,这样的运行对本文件不会造成任何影响),能不用则不用
LeetCode使用之两数之和(示例)
给定一个整数数组(列表) nums 和一个目标值 target,请你在该数组中找出和为目标值的那 两个 整数,并返回他们的数组下标。你可以假设每种输入只会对应一个答案。但是,你不能重复利用这个数组中同样的元素。
示例1:
给定 nums = [2, 7, 11, 15], target = 9
因为 nums[0] + nums[1] = 2 + 7 = 9
所以返回 [0, 1]
# 需求1: 在该数组中找出和为目标值的那 两个 整数
# 需求2: 返回他们的数组下标
# 条件: 你不能重复利用这个数组中同样的元素
nums = [2, 7 11, 15]
target = 9
for i in range(len(nums)):
for j in range(i+1, len(nums)):
if nums[i] + num[j] = target:
return i,j
# 循环一次,用减法得到结果,判断是否在nums内
nums = [2, 7 11, 15]
target = 9
for i in range(len(nums)):
sub = target - nums[i]
if sub in nums:
res = nums.index(sub)
if r
return i,res
字符串内置方法
a = 'mrbigb'
# 索引取值
print(a[0]) # m
# 切片
print(a[0:5]) # mrbig
# 成员运算
print('bigb' in a) # True
print('bigb1' not in a) # True
# for循环
for i in a:
print(i) # m r b i g b
# len()
print(len(a)) # 6
a = '**mrbigb**'
# .strip(): 去掉两端元素
print(a.strip()) # 去除两端空格
print(a.strip('*')) # 去除两端* mrbigb
# lstrip()/rstrip(): 去除左端/右端元素
print(a.lstrip('*')) # mrbigb**
print(a.rstrip('*')) # **mrbigb
# .startswith()/endswith(): 判断以...开头/以...结尾
print(a.startswith('mr')) # True
print(a.endswith('bigb')) # True
# .find()/index() 获取某一个元素的索引位置
print(a.find('x')) # 找不到返回-1
# print(a.index('x')) # 找不到报错
# .join() 把列表内的元素拼接出来
print('*'.join(['a', 'b', 'c'])) # a*b*c
# .split(): 切割
a = 'a*b*c'
print(s.split('*')) # 以*为切割符号,切割字符串
# .center/ljust/rjust : 打印更美观,居中/居左/居右
print(a.center(50, '-')) # 居中, 两边各50个'_'
print(a.ljust(50, '-')) # 靠左, 右边50个'_'
print(a.rjust(50, '-')) # 靠右, 左边50个'_'
# .isdigit()/isalpha()
print(a.isdigit()) # 是否为纯数字
print(a.isalpha()) # 是否为纯字母
# .count() 计数
print(a.count('bigb')) # 1
# .replace() 替换
a.replace('bigb', 'bigme') # 将字符串中的bigb替换成bigme
爬虫基础3
selenium基本使用
# 导入webdriver驱动浏览器
from selenium import webdriver
import time
# 通过 webdriver 驱动浏览器加载驱动
# webdriver.Chrome('驱动绝对路径')
driver = webdriver.Chrome(r'D:\chromedriver\chromedriver.exe')
try:
# 等待浏览器数据加载10秒
driver.implicitly_wait(10)
driver.get(r'https://www.baidu.com/') # 输入百度网址
# 找到搜索框并输入python
input_tag = driver.find_element_by_id('kw')
input_tag.send_keys('python')
# 找到百度一下按钮并点击
submit_tag = driver.find_element_by_id('su')
submit_tag.click()
# 等待10秒
time.sleep(10)
finally:
driver.close()
selenium模拟百度登录
from selenium import webdriver
import time
# 通过webdriver加载驱动
driver = webdriver.Chrome(r'D:\chromedriver\chromedriver.exe')
try:
# 打开浏览器访问百度主页
driver.implicitly_wait(10)
driver.get('https://www.baidu.com')
# 通过文本找到登录按钮并点击
login_botton = driver.find_element_by_link_text('登录')
login_botton.click()
time.sleep(3)
# 通过id找到用户名登录按钮并点击
user_login_tag = driver.find_element_by_id('TANGRAM__PSP_10__footerULoginBtn')
user_login_tag.click()
time.sleep(3)
# 通过id找到账号输入框并输入
id_input = driver.find_element_by_id('TANGRAM__PSP_10__userName')
id_input.send_keys('18895317622')
time.sleep(3)
# 通过id找到密码输入框并输入
password_input = driver.find_element_by_id('TANGRAM__PSP_10__password')
password_input.send_keys('0123456')
time.sleep(3)
# 找到并点击登录按钮
submit = driver.find_element_by_id('TANGRAM__PSP_10__submit')
submit.click()
time.sleep(10)
finally:
driver.close()
selenium爬取京东商品信息
from selenium import webdriver
from selenium.webdriver.common.keys import Keys # 键盘按键操作
import time
try:
# 加载驱动
driver = webdriver.Chrome(r'D:\chromedriver\chromedriver.exe')
# 打开京东首页
driver.implicitly_wait(10)
driver.get('https://www.jd.com/')
time.sleep(5)
# 通过id找到搜索栏并搜索'手机'
ser_bar = driver.find_element_by_id('key')
ser_bar.send_keys('手机')
# 模拟键盘按enter键
ser_bar.send_keys(Keys.ENTER)
time.sleep(5)
# 按销量排序
# 按文本找到销量按钮并点击
sales_volume_botton = driver.find_element_by_link_text('销量')
sales_volume_botton.click()
time.sleep(5)
# 通过id查找所以商品的父标签
goods_div = driver.find_element_by_id('J_goodsList')
# 通过class查找goods.div所以li标签
goods_list = goods_div.find_elements_by_class_name('gl-item')
# 循环获取goods_list里每一个li标签
for goods in goods_list:
# 获取价格文本
# css 属性选择器
# 通过css_selector获取商品价格
goods_price = goods.find_element_by_css_selector('.p-price i').text
# 通过css_selector获取商品名称
goods_name = goods.find_element_by_css_selector('.p-name em').text
# 通过css_selector获取商品评价人数
goods_commit = goods.find_element_by_css_selector('.p-commit a').text
# 通过css_selector获取商品详情链接
goods_url = goods.find_element_by_css_selector('.p-commit a').get_attribute('href')
goods_data = f'''
商品名称: {goods_name}
商品价格: {goods_price}
评价人数: {goods_commit}
商品详情: {goods_url}
'''
# 保存数据
with open('jd goods list.text', 'a', encoding='utf-8') as f:
f.write(goods_data)
time.sleep(10)
finally:
driver.close()
Day 07 字符串内置方法和爬虫基础3的更多相关文章
- 7.python字符串-内置方法分析
上篇对python中的字符串内置方法进行了列举和简单说明,但这些方法太多,逐一背下效率实在太低,下面我来对这些方法按照其功能进行总结: 1.字母大小写相关(中文无效) 1.1 S.upper() -& ...
- 6.python字符串-内置方法列举
所谓内置方法,就是凡是字符串都能用的方法,这个方法在创建字符串的类中,下面是总结: 首先,我们要学习一个获取帮助的内置函数 help(对象) ,对象可以是一个我们创建出来的,也可以是创建对象的那个类, ...
- python字符串-内置方法列举
所谓内置方法,就是凡是字符串都能用的方法,这个方法在创建字符串的类中,下面是总结: 首先,我们要学习一个获取帮助的内置函数 help(对象) ,对象可以是一个我们创建出来的,也可以是创建对象的那个类, ...
- python字符串内置方法
网上已经有很多,自己操作一遍,加深印象. dir dir会返回一个内置方法与属性列表,用字符串'a,b,cdefg'测试一下 dir('a,b,cdefg') 得到一个列表 ['__add__', ' ...
- python中字符串内置方法
字符串类型 作用:定义姓名.性别等 定义方式: s='lzs' #\n换行 \t缩进4个空格 \r回退上一个打印结果,覆盖上一个打印结果 加上一个\让后面的\变得无意义 内置方法: (优先掌握) 1. ...
- python字符串-内置方法用法分析
1.字母大小写相关(中文无效) 1.1 S.upper() -> string 返回一个字母全部大写的副本
- python 字符串内置方法实例
一.字符串方法总结: 1.查找: find(rfind).index(rindex).count 2.变换: capitalize.expandtabs.swapcase.title.lower.up ...
- python中的字符串内置方法小结
#!/usr/local/bin/python3 # -*- coding:utf-8 -*- ''' name="my wife is mahongyan" ---------- ...
- Python 字符串内置方法笔记
一. 大小写转换 ① capitalize() capitalize() #字符串首字母大写 >>> str0 = 'hello World' >>> str0.c ...
随机推荐
- 领扣(LeetCode)字符串相加 个人题解
给定两个字符串形式的非负整数 num1 和num2 ,计算它们的和. 注意: num1 和num2 的长度都小于 5100. num1 和num2 都只包含数字 0-9. num1 和num2 都不包 ...
- ZeroC ICE的远程调用框架 class与interface
我们在ice文件中定义的class或interface,slice都会为我们生成stub存根类和skeleton骨架类.在这里要注意slice并没有分别生成两份单独用在客户端或服务端的接口给开发分发. ...
- 护网杯2019 mergeheap --pwn
护网 又是签到 一天 这道题一开始 不懂得如何泄露 libc 信息,就蒙了 后来群里师傅也是刚刚好 做出 到这里 我就接着做了 . 先看下保护,发现 全开了 然后 就看下流程 大概 就是添加 c ...
- 【论文阅读】Learning Dual Convolutional Neural Networks for Low-Level Vision
论文阅读([CVPR2018]Jinshan Pan - Learning Dual Convolutional Neural Networks for Low-Level Vision) 本文针对低 ...
- 基于loghub的消息消费延迟监控
我们可以把loghub当作一个消息中间件来使用.如果能知道当前的消费进度,自然好了,否则消费情况一无所知,总是有点慌! loghub消费分两种情况,一是普通消费,二是消费组消费: 消费组消费,logh ...
- 图解 Spring:HTTP 请求的处理流程与机制【1】
2003 年,老兵哥初到中兴开始研究生实习,Spring 就是那年诞生的,2004 年 3 月发布了 1.0 版本,到现在已经超过 15 年了.从单体式分层架构到云原生微服务架构,它稳坐在 JAVA ...
- 【Java并发系列】----JUC之Lock
显式锁 Lock 在Java 5.0之前,协调共享对象的访问时可以使用的机制只有synchronized和volatile.Java 5.0后增加了一些新的机制,但并不是一种替代内置锁的方法,而是当内 ...
- day20191006假期作业收尾
国庆作业:(轻重缓急,重点代码看懂理解了.每天重心就是代码,理解代码,理解,understand the code.花时间花功夫.只要功夫深,铁杵磨成针.) 一.使用DAO设计模式操作数据库CRUD( ...
- 关于JAVA,特点,历史,编译式的语言&解释式的语言,什么是java?JDK?DOS?一次编译到处运行原理。
1.java语言的特点: 简单的:面向对象的:跨平台(操作系统)的(一次编译,到处运行):高性能的: 2.类名的首字母大写,方法小写: 3.历史: java2(即java),为什么加个2呢?1998年 ...
- 远程连接mysql出现1045错误的解决办法
第一步:停止MySQL服务 第二步:在你MySQL的安装目录下找到my.ini,文件,打开文件查找到 [mysqld] ,在其下方添加上一行 skip-grant-tables,然后保存. 第三步:启 ...