基础数据类型的补充;编码的进阶

  • str

    • capitalize() 首字母(第一个单词)大写,其余变小写

      s1 = 'I LIVE YOU'
      print(s1.capitalize())
      >>>I live you
    • title() 每个单词的首字母大写。(以特殊字符(非字母)隔开的即为一个单词)

      s1 = 'I LIVE YOU'
      print(s1.title())
      >>>I Live You
    • swapcase() 大小写反转

      s1 = 'I love YOU'
      print(s1.swapcase())
      >>>i LOVE you
    • center() 居中,有1个必选参数:宽度,一个非必选参数:填充)

      s1 = 'I'
      print(s1.center(10,'%'))
      >>>%%%%I%%%%%
    • find() 通过元素找索引,找到第一个就返回,找不到返回-1。

      s1 = 'I love you'
      print(s1.find('o'))
      >>>3
    • index() 通过元素找索引,找到第一个就返回,找不到就报错。

  • tuple

    • 特殊性:元祖中只有一个元素,并且没有’,‘,则它不是元祖,它与括号中的数据类型一致

      tu0 = (1,2)
      print(tu0,type(tu0))
      >>>(1, 2) <class 'tuple'> tu1 = (1)
      print(tu1,type(tu1))
      >>>1 <class 'int'> tu2 = ([1])
      print(tu2,type(tu2))
      >>>[1] <class 'list'> tu3 = (1,)
      print(tu3,type(tu3))
      >>>(1, ) <class 'tuple'>
    • count() 计数

      tu = (1,2,3,3,3,3)
      print(tu.count())
      >>>4
    • index() 找索引

      tu = ['a','b','a']
      print(tu.index('a'))
      >>>0
  • list

    • index() 通过元素找索引

      l1 = ['a','b','a']
      print(l1.index('a'))
      >>>0
    • sort() 默认从小到大排序,设置reverse参数则可从小到大

      l1 = [3,2,1,4]
      l1.sort()
      print(l1)
      >>>[1,2,3,4] l1.sort(reverse=True)
      print(l1)
      >>>[4,3,2,1]
    • reverse() 反转

      l1 = [2,1,3,0]
      l1.reverse()
      print(l1)
      >>>[0,3,1,2]
    • 列表相加 (3.4以上版本)

      l1 = [1,2,3]
      l2 = [3,4,5]
      print(l1+l2)
      >>>[1, 2, 3, 3, 4, 5]
    • 列表与数字相乘 (3.4以上版本)

      l1 = [2,'a',[1,'b']]
      l2 = l1*3
      print(l2)
      >>>[2, 'a', [1, 'b'], 2, 'a', [1, 'b'], 2, 'a', [1, 'b']]
    • 列表的特殊性:正向循环一个列表时如果删除某个元素,那么这个元素后面的所有元素都会向前进一位,它们的索引相比之前也会前进一位,因此,在循环一个列表时的过程中,如果要改变列表的大小(增加值或者删除值),那么结果很可能会出错或者报错。

      l1 = [1,2,3,4,5,6]  #删除列表中索引位为偶数的元素。
      for i in range(0,len(l1),2):
      l1.pop(i)
      print(l1)
      >>>IndexError: pop index out of range
      • 解决此问题有三种方式

        1.直接删除 (按照元素删除,按照索引删除,切片加步长

        #切片加步长
        l1 = [1,2,3,4,5,6]
        del l1[1::2]
        print(l1)

        2.倒叙删除

        l1 = [1,2,3,4,5,6]
        for i in range(len(l1)-1,-1,-2):
        l1.pop(i)
        print(l1)
        >>>[1,3,5] #不能用以下代码;请自测
        l1 = [1,2,3,4,5,6]
        for i in range(1,len(l1),2):
        l1.pop(-i)

        3.思维转换

        l1 = [1,2,3,4,5,6]
        l2 = []
        for i in range(0,len(l1),2):
        l2.append(l1[i])
        l1 = l2
        print(l1)
  • dict

    • popitem 3.5版本之前,随机删除,3.6版本之后,删除最后一个,有返回值。 请自测。

    • update

      dic0 = {1:'i'}
      dic0.update(2='love',hobby='python') #增加键值对
      print(dic0)
      >>>{1: 'i', 2: 'love', 'hobby': 'python'} dic0.update(1 = '太阳') #改键值对
      print(dic0)
      >>>{1: '太阳', 2: 'love', 'hobby': 'python'} dic1 = {}
      dic1.update([(1,'a'),(2,'b'),(3,'c')])
      print(dic1)
      >>>{1: 'a', 2: 'b', 3: 'c'} dic0.update(dic1)
      print(dic0) #有则覆盖,无则增加
      >>>{1: 'a', 2: 'b', 'hobby': 'python', 3: 'c'}
      print(dic1)
      >>>{1: 'a', 2: 'b', 3: 'c'}
    • fromkeys() 第一个参数必须为可迭代对象,可迭代的对象共用第二个参数(id相同)。

      dic = dict.fromkeys('abc',1)
      print(dic)
      >>>{'a': 1, 'b': 1, 'c': 1} dic = dict.fromkeys([1,2,3],[])
      print(dic)
      >>>{1: [], 2: [], 3: []}
      dic[1].append('a')
      print(dic)
      >>>{1: ['a'], 2: ['a'], 3: ['a']}
    • 小题试做:(循环一个字典时,若果改变字典的大小则或报错。)

      #将字典dic中的以‘k’开头的键值对删除
      dic = {'k1':'a','k2':'b','k3':'c','a':'d'}
      l1 = []
      for key in dic:
      if key.startswith('k'):
      l1.append(key)
      for i in l1:
      dic.pop(i)
      print(dic)
      >>>{'a':'d'} #改进
      for key in list(dic.keys()): #将其转换为一个列表,若不加list则回报错。
      if 'k' in key:
      dic.pop(key)
      print(dic)
      >>>{'a','d'}
  • 数据之间类型的转换:

    • int bool str 三者转换

    • str list 两者转换

    • list set 两者转换

    • str bytes 两者转换

    • 所有数据都可以转换成bool值:

      转换成bool值为False的数据类型有:

      '',0,(),{},[],set(),None
  • 基础数据结构类型的总结

    • 按照储存空间的占用分(从低到高)

      • int
      • str
      • set : 无序
      • tuple: 有序,不可变
      • list: 有序,可变
      • dict: 有序(3.6版本之后),可变
  • 编码的进阶:

    • 不同的编码方式之间不能相互识别

    • 数据在内存中全部是以Unicode编码的,但是当数据用于网络传输或者存储到硬盘中,必须是以非Unicode编码(utf-8、gbk等)

    • python中的数据从内存(Unicode编码)存储到硬盘或进行网络传输时要经历一个特殊的转化过程,要转化为一个非Unicode编码类型的特殊数据才能进行传输或储存至硬盘,即bytes类型(内存中的编码方式:非Unicode) 内存中的数据(int,bool,list,dict,set,tuple)都不能直接转换为bytes类型,是先自动转换为字符串(Unicode编码)类型,再转换为bytes类型。

      • bytes与str的操作方式大部分都是一样的
      • bytes can only contain ASCII literal characters,手动将中文字符串转化为bytes类型会报错,要经过特殊的转化
      #str转bytes:
      a = b'iloveyou'
      print(a,type(a))
      >>>b'iloveyou' <class 'bytes'> #将中文转化为bytes类型:
      b = b'山就在那儿'
      print(b)
      >>>SyntaxError: bytes can only contain ASCII literal characters
      #正确方法为: c = '山就在那儿'
      b = c.encode('utf-8')
      print(b) #or print(c.encode('utf-8')) #一般指定utf-8的编码形式, (encode:编码)
      >>>b'\xe5\xb1\xb1\xe5\xb0\xb1\xe5\x9c\xa8\xe9\x82\xa3\xe5\x84\xbf'
      • bytes可转化为字符串类型(Unicode)(decode,解码)。用什么编码类型转换为bytes数据类型的就用什么解码。

        b = b'\xe5\xb1\xb1\xe5\xb0\xb1\xe5\x9c\xa8\xe9\x82\xa3\xe5\x84\xbf'
        c = b.decode('utf-8') or print(b.decode('utf-8'))
        print(c)
        >>>山就在那儿 #用什么编码类型转换为bytes数据类型的就用什么解码。
        b = b'\xe5\xb1\xb1\xe5\xb0\xb1\xe5\x9c\xa8\xe9\x82\xa3\xe5\x84\xbf'
        c = b.decode('gbk')
        print(c)
        >>>UnicodeDecodeError: 'gbk' codec can't decode byte 0xbf in position 14: incomplete multibyte sequence
  • 小题试做:gbk转换为utf-8

    #分析,所有的编码都与Unicode有关(计算机内存中以Unicode编码),因此可先将gbk转换为Unicode编码,再转换为utf-8编码。
    
    gbk = b'\xc9\xbd\xbe\xcd\xd4\xda\xc4\xc7\xb6\xf9'
    decode1 = gbk.decode('gbk') #解码为Unicode编码的字符串,可print(decode1)查看。
    print(decode1.encode('utf-8')) #以utf-8编码
    >>>b'\xe5\xb1\xb1\xe5\xb0\xb1\xe5\x9c\xa8\xe9\x82\xa3\xe5\x84\xbf'

python基础学习day7的更多相关文章

  1. Python基础学习Day7 基础数据类型的扩展 集合 深浅copy

    一.基础数据类型的扩展 1.1GBK ---> UTF - 8 # str --->bytes s1 = '太白' # 字符串是unicode编码 b1 = s1.encode('gbk' ...

  2. Day1 Python基础学习

    一.编程语言分类 1.简介 机器语言:站在计算机的角度,说计算机能听懂的语言,那就是直接用二进制编程,直接操作硬件 汇编语言:站在计算机的角度,简写的英文标识符取代二进制去编写程序,本质仍然是直接操作 ...

  3. 0003.5-20180422-自动化第四章-python基础学习笔记--脚本

    0003.5-20180422-自动化第四章-python基础学习笔记--脚本 1-shopping """ v = [ {"name": " ...

  4. Day1 Python基础学习——概述、基本数据类型、流程控制

    一.Python基础学习 一.编程语言分类 1.简介 机器语言:站在计算机的角度,说计算机能听懂的语言,那就是直接用二进制编程,直接操作硬件 汇编语言:站在计算机的角度,简写的英文标识符取代二进制去编 ...

  5. Python 基础学习 总结篇

    Python 基础学习总结 先附上所有的章节: Python学习(一)安装.环境配置及IDE推荐 Python学习(二)Python 简介 Python学习(三)流程控制 Python学习(四)数据结 ...

  6. (一)python基础学习

    根据廖雪峰老师的python教程写一些学习总结! Python基础学习 1.使用list和tuple (1)list Python内置的一种数据类型是列表:list.list是一种有序的集合,可以随时 ...

  7. python基础学习(起步)

    目录 python基础学习(起步) 变量 常量 变量的内存管理 python垃圾回收机制 变量的其他赋值方式 今日编程小题 本人能力有限,若有偏颇之处请读者大大不吝赐教! 祝大家每天都在成长! pyt ...

  8. Python基础学习二

    Python基础学习二 1.编码 utf-8编码:自动将英文保存为1个字符,中文3个字符.ASCll编码被囊括在内. unicode:将所有字符保存为2给字符,容纳了世界上所有的编码. 2.字符串内置 ...

  9. Python基础学习一

    Python基础学习一 1.变量与常量 变量名:大小写英文.数字.下划线的组合,数字不能开头 常量名:习惯上常量用大写字母命名,例如"PI" 2.多行输出 转义符:反斜杠(),如果 ...

随机推荐

  1. [LC] 169. Majority Element

    Given an array of size n, find the majority element. The majority element is the element that appear ...

  2. firefox45版本与seleniumIDE

    firefox45版本与seleniumIDE https://blog.csdn.net/seanlyly/article/details/80203896 seleniumIDE与firefox版 ...

  3. fare|gave it away|catch a glimpse |involve|rip|eternalstiff|

    N-COUNT 旅费;路费;车费A fare is the money that you pay for a journey that you make, for example, in a bus, ...

  4. Dubbo的集群容错与负载均衡策略

    Dubbo的集群容错策略 正常情况下,当我们进行系统设计时候,不仅要考虑正常逻辑下代码该如何走,还要考虑异常情况下代码逻辑应该怎么走.当服务消费方调用服务提供方的服务出现错误时候,Dubbo提供了多种 ...

  5. 严谨与特色并行——WSDM 2015大会见闻记

    2015大会见闻记" title="严谨与特色并行--WSDM 2015大会见闻记"> 第8届ACM网络搜索与数据挖掘会议(ACM International Co ...

  6. hexo-next-travis-ci 构建自动化部署博客

    构建效果如上面视频所示,如果浏览器不支持请戳一下链接: 自动化部署构建效果 .只要将编辑的 .md 文件推送到 github 上,博客网站就可以更新这篇文章. 其实差不多半年前也构建过一次,由于安装 ...

  7. sphinx + mysql 全文索引配置

    参考地址 http://v9.help.phpcms.cn/html/2010/search_0919/35.html http://blog.sina.com.cn/s/blog_705e4fdc0 ...

  8. idea激活教程(永久)支持2019 3.1 亲测

    此教程已支持最新2019.3版本 本教程适用Windows.Mac.Ubuntu等所有平台. 激活前准备工作 配置文件修改已经不在bin目录下直接修改,而是通过Idea修改 如果输入code一直弹出来 ...

  9. LeetCode 225题用队列实现栈(Implement Stack using Queues) Java语言求解

    链接 https://leetcode-cn.com/problems/implement-stack-using-queues/ 思路 首先演示push()操作:将元素依次进入队1,进入时用top元 ...

  10. 基于layPage分页插件浅析两种分页方式

    最近在开发过程中经常用到分页,今天挤出些时间来捋一捋自己的经验 在web开发中,一般显示数据列表页时,我们会用到分页控件来显示数据.采用分页一般基于两种不同的需求,一种是数据量不算很大,但是在页面展示 ...