python学习笔记之基础二（第二天）

银角大王之博客二：

http://www.cnblogs.com/wupeiqi/articles/4911365.html

1、编码转换介绍

<1> . python2里有二种字符串unicode和str，其中unicode是最底层、最纯的，会根据终端的编码进行转化展示

str可以看作是unicode字符串经过某种编码后的字节组成的数组
unicode是真正意义上的字符串
通过 encode 可以将unicode类型编码为str类型
通过 decode 可以将str类型解码为unicode类型
python 会隐式地进行编码、解码，默认采用 ascii
所有的编码、解码错误都是由于所选的编码、解码方式无法表示某些字符造成的

Python 2 悄悄掩盖掉了 byte 到 unicode 的转换，只要数据全部是 ASCII 的话，所有的转换都是正确的，一旦一个非 ASCII 字符偷偷进入你的程序，那么默认的解码将会失效，从而造成 UnicodeDecodeError 的错误。py2编码让程序在处理 ASCII 的时候更加简单。你复出的代价就是在处理非 ASCII 的时候将会失败。

一般硬盘存储或传输为utf-8（因为省空间、省带宽），读入内存中为unicode，二者如何转换

a = '你好' '\xe4\xbd\xa0\xe5\xa5\xbd' <type 'str'>

b = u'你好' u'\u4f60\u597d' <type 'unicode'>

a.decode('utf-8') u'\u4f60\u597d' (utf-8格式解码为unicode)

b.encode('utf-8') '\xe4\xbd\xa0\xe5\xa5\xbd' (unicode格式加密为utf-8)

注：在python2.7版本中需要如上转换，在脚本中如要显示中文，

只要在文件开头加入 # _*_ coding: UTF-8 _*_ 或者 #coding=utf-8 就行了

<2> . python3也有两种数据类型：str和bytes； str类型存unicode数据，bytse类型存bytes数据，与py2比只是换了一下名字而已。

要将str类型转化为bytes类型，使用encode()内置函数；反过来，使用decode()函数

<3> . python2与python3字符串编码的区别

python3默认使用的是str类型对字符串编码，默认使用bytes操作二进制数据流，两者不能混淆！！
Python3有两种表示字符序列的类型：bytes和str。前者的实例包含原始的8位值，后者的实例包含Unicode字符。Python2也有两种表示字符序列的类型，分别叫做str和Unicode，与Python3不同的是，str实例包含原始的8位值；而unicode的实例，则包含Unicode字符。

2、字符串的常用函数format：

S.format(*args, **kwargs) -> string

Return a formatted version of S, using substitutions from args and kwargs.
The substitutions are identified by braces ('{' and '}').

        name1 = "I am {0},age is {1}" 

        name1.format('kevin',33)

        li = ['kevin',33]

        name1.format(*li)

        name2 = "I am {ss},age is {dd}" 

        name2.format(ss='kevin',dd=33)

        dic = {'ss': 'kevin','dd':33}

        name2.format(**dic)

3、元组的元素是不能被修改，但元素的元素能可以被被修改的

>>> aa = (1,2,'a','b',['a',1,'b',2])

>>> aa

(1, 2, 'a', 'b', ['a', 1, 'b', 2])

>>> aa[-1]

['a', 1, 'b', 2]

>>> aa[-1].append('aaaa')

>>> aa

(1, 2, 'a', 'b', ['a', 1, 'b', 2, 'aaaa'])

4、字典的循环

当数据量达到上百万时，循环字典就不适合用dict.items()，因为首先会把一对对key和value转化为列表，然后在循环遍历输出，会增加内存使用。建议使用如下：

>>> a = {1:'a',2:'b'}

>>> for k in aa:print(k,aa[k])

(1, 'a')

(2, 'b')

>>> for k in aa.keys():print(k,aa[k])

(1, 'a')

(2, 'b')

5、调用系统命令，并存入变量:

1).import os

a = os.system('df -Th') 可以获取命令执行后的返回值，但是获取不了命令的输出内容

b = os.popen('df -Th','r') 可以获取命令的输出内容，但是获取不了命令执行后的返回值

a = os.popen("ls -l",'r')

for i in a.readlines():

print(i.strip())

c = os.path.dirname(os.path.abspath(__file__)) 获取当前的目录

2).import commands

c = commands.getoutput('df -Th') 返回一个字符串

commands.getstatusoutput(cmd)返回（status,output)

commands.getoutput(cmd)只返回输出结果

3). import subprocess

<1>. call

　　执行命令，返回状态码，shell = True允许shell命令时字符串形式

subprocess.call(["ls", "-l"])

subprocess.call("exit 1", shell=True)

<2>. check_call

　　执行命令，如果执行状态码是0，则返回0，否则抛出异常

subprocess.check_call(["ls", "-l"])

subprocess.check_call("exit 1", shell=True)　

<3>.check_output

　　执行命令，如果状态码是0，则返回执行结果，否则抛出异常

subprocess.check_output(["echo", "Hello World!"])

subprocess.check_output("exit 1", shell=True)

<4>. subprocess.getstatusoutput(cmd)

调用check_output(cmd, shell=True, universal_newlines=True, stderr=STDOUT)，返回tuple(status,data)

<5>. getoutput(cmd)

返回命令的输出结果或错误输出，即getstatusoutput(cmd)[1]

<6>. subprocess.Popen(...)　

　　用于执行复杂的系统命令

参数：

args: 可以是字符串或者序列类型（如：list, tuple）。默认的，要执行的程序应该是序列的第一个字段，如果是单个字符串，它的解析依赖于平台。在unix中，如果args是一个字符串，那么这个字符串解释成被执行程序的名字或路径，然而，这种情况只能用在不需要参数的程序。
bufsieze: 指定缓冲。0表示无缓冲，1表示缓冲，任何其他的整数值表示缓冲大小，负数值表示使用系统默认缓冲，通常表示完全缓冲。默认值为0即没有缓冲。
stdin, stdout, stderr：分别表示程序的标准输入，输出，错误句柄
preexec_fn : 只在unix平台有效，用于指定一个可执行对象，它将在子进程中运行之前被调用
close_fds : 在windows平台下，如果close_fds被设置为true，则新创建的子进程将不会继承父进程的输入，输出，错误管道。所以不能将close_fds设置为true同时重定向子进程的标准输入，输出与错误。
shell : 默认值为False, 声明了是否使用shell来执行程序，如果shell=True,它将args看做一个字符串，而不是一个序列。在unix系统中，且shell=True, shell默认使用/bin/sh。
cwd : 用于设置子进程的当前目录。当它不为None时，子程序在执行前，它的当前路径会被替换成cwd的值。这个路径并不会被添加到可执行程序的搜索路径，所以cwd不能是相对路径。
env : 用于指定子进程的环境变量。如果env=None,子进程的环境变量将从父进程中继承。当它不为None时，它是新进程的环境变量的映射。可以用它来代替当前进程的环境。
universal_newlines : 不同系统的换行符不同，文件对象stdout和stderr都被以文本文件的方式打开
startupinfo 与 createionflags只在windows下生效。将被传递给底层的CreateProcess()函数，用于设置子进程的一些属性，如：主窗口的外观，进程的优先级等等

例：

subprocess.Popen(["df","-Th"])

注：Popen对象创建后，主程序不会自动等待子进程完成，我们必须调用对象的wait()方法，父进程才会等待 (也就是阻塞block)

child = subprocess.Popen(["ping","-c","5","www.baidu.com"])
child.wait()
print("parent process")

此外，你还可以在父进程中对子进程进行其它操作，比如我们上面例子中的child对象:
child.poll() # 检查子进程状态
child.kill() # 终止子进程
child.send_signal() # 向子进程发送信号
child.terminate() # 终止子进程
子进程的PID存储在child.pid

实例：

#!/usr/bin/python3

import subprocess,os,sys

#obj = subprocess.Popen("mkdir t3", shell=True, cwd='/tmp',)

#

#obj = subprocess.Popen(["python3"], stdin=subprocess.PIPE, stdout=subprocess.PIPE, stderr=subprocess.PIPE, universal_newlines=True)

#obj.stdin.write("a = 35 * 20 + 31 \n")

#obj.stdin.write("print(a)\n")

#obj.stdin.write("b = 3 / 0\n")

#obj.stdin.write("print(b)")

#obj.stdin.close()

#

#cmd_out = obj.stdout.read()

#obj.stdout.close()

#cmd_error = obj.stderr.read()

#obj.stderr.close()

#

#print(cmd_out)

#print("the cmd_error is %s" % cmd_error)

#

#obj1 = subprocess.Popen(["python3"], stdin=subprocess.PIPE, stdout=subprocess.PIPE, stderr=subprocess.PIPE, universal_newlines=True)

#

#obj1.stdin.write("a = 35 * 20 + 31 \n")

#obj1.stdin.write("print(a)")

#out_error_list = obj1.communicate()

#print(out_error_list)

#

#

#

#obj2 = subprocess.Popen(["python3"], stdin=subprocess.PIPE, stdout=subprocess.PIPE, stderr=subprocess.PIPE, universal_newlines=True)

#

#out_error_list = obj2.communicate('print("hello")')

#print(out_error_list)

#

#

#child1 = subprocess.Popen("ls bb",shell=True, stdout=subprocess.PIPE)

#print(child1.stdout.read())

#child2 = subprocess.Popen(["cat"], stdin=child1.stdout,stdout=subprocess.PIPE)

#print(child2.stdout.read())

#out = child2.communicate()

#print(out[0].decode('utf-8'))

#

#

child = subprocess.Popen(["cat"], stdin=subprocess.PIPE,stdout=subprocess.PIPE)

child.communicate('bb'.encode('utf-8'))

cc = child.stdout.read()

print(cc)

child.stdout.close()

#output_file = open("abc",'w');

#return_code = subprocess.call(['ls','-l'],stdout=output_file);

#output_file.close();

#print(return_code);

subprocess实例

6、sys调用

import sys

sys.exit

print sys.argv

sys.path

7、导入模板方法：

1.import sys [as newname]

多次重复使用import语句时，不会重新加载被指定的模块，只是把对该模块的内存地址给引用到本地变量环境。

2.from sys import argv或(*)

3.reload()

reload会重新加载已加载的模块，但原来已经使用的实例还是会使用旧的模块，而新生产的实例会使用新的模块；reload后还是用原来的内存地址；不能支持from。。import。。格式的模块进行重新加载。

建议使用第一种，第二种导入的对象或变量会与当前的变量会冲突。

8、字典复制：

dict = {'name':'wang', 'sex':'m', 'age':34, 'job':'it'}

info = dict ##别名（二个字典指向内存的同一地址空间）

info1 = dict.copy() #shadow copy 浅复制（嵌套字典第一层独立，第二层以下相关联）

import copy

copy.copy() #shadow copy 浅复制

copy.deepcopy() #deep copy 深复制（完全独立）

注：浅复制下的关联只是针对字典初始状态包含的嵌套对象，后新加的不会

例：

>>> dict
{'info': ['a', 'b', 1, 2], 'job': 'it', 'sex': 'm', 'age': 40, 'name': 'wang'}
>>> dict_alias = dict
>>> dict_copy = copy.copy(dict)
>>> dict_deep = copy.deepcopy(dict)

#添加、改变、删除第一层的对象键值，浅复制和深复制都不受影响

>>> dict['age'] = 32

>>> del dict['sex']
>>> dict
{'info': ['a', 'b', 1, 2], 'job': 'it', 'age': 32, 'name': 'wang'}
>>> dict_alias
{'info': ['a', 'b', 1, 2], 'job': 'it', 'age': 32, 'name': 'wang'}
>>> dict_copy
{'info': ['a', 'b', 1, 2], 'job': 'it', 'age': 40, 'name': 'wang', 'sex': 'm'}
>>> dict_deep
{'info': ['a', 'b', 1, 2], 'job': 'it', 'age': 40, 'name': 'wang', 'sex': 'm'}

#改变、删除原有的第二层的对象键值，浅复制受影响，而深复制都不受影响

>>> dict['info'][2] = 100
>>> dict
{'info': ['a', 'b', 100, 2], 'job': 'it', 'age': 32, 'name': 'wang'}
>>> dict_alias
{'info': ['a', 'b', 100, 2], 'job': 'it', 'age': 32, 'name': 'wang'}
>>> dict_copy
{'info': ['a', 'b', 100, 2], 'job': 'it', 'age': 40, 'name': 'wang', 'sex': 'm'}
>>> dict_deep
{'info': ['a', 'b', 1, 2], 'job': 'it', 'age': 40, 'name': 'wang', 'sex': 'm'}

#添加第二层的对象，浅复制和深复制都不受影响

>>> dict['new'] = {'a':1, 'b':2, 'c':5}
>>> dict
{'info': ['a', 'b', 100, 2], 'name': 'wang', 'age': 32, 'job': 'it', 'new': {'a': 1, 'c': 5, 'b': 2}}
>>> dict_alias
{'info': ['a', 'b', 100, 2], 'name': 'wang', 'age': 32, 'job': 'it', 'new': {'a': 1, 'c': 5, 'b': 2}}
>>> dict_copy
{'info': ['a', 'b', 100, 2], 'job': 'it', 'age': 40, 'name': 'wang', 'sex': 'm'}
>>> dict_deep
{'info': ['a', 'b', 1, 2], 'job': 'it', 'age': 40, 'name': 'wang', 'sex': 'm'}

9、内置函数说明:

__name__：主文件时返回main，否则返回文件名，可用来判断是否说主文件还是导入模块；

__file__：文件的绝对路径；

__doc__：文件开头的注释说明

例：

'''
created by 2015-12-18
@author: kevin
'''

if __name__ == '__main__':
    print('this is main file')
    print(__file__)
    print(__doc__)

python学习笔记之基础二（第二天）的更多相关文章

python学习笔记（基础二：注释、用户输入、格式化输出）
注释单行:# 多行:上下各用3个连续单引号或双引号 3个引号除了多行注释,还可以打印多行举例: msg = ''' name = "Alex Li" name2 = name ...
Python学习笔记之基础篇（-）python介绍与安装
Python学习笔记之基础篇(-)初识python Python的理念:崇尚优美.清晰.简单,是一个优秀并广泛使用的语言. python的历史: 1989年,为了打发圣诞节假期,作者Guido开始写P ...
Python学习笔记之基础篇（二）python入门
一.pycharm 的下载与安装: 使用教程:https://www.cnblogs.com/jin-xin/articles/9811379.html 破解的方法:http://xianchang. ...
python学习笔记-（十二）scoket编程基础
socket通常也称作"套接字",用于描述IP地址和端口,是一个通信链的句柄,应用程序通常通过"套接字"向网络发出请求或者应答网络请求. socket起源于Un ...
python学习笔记（基础四：模块初识、pyc和PyCodeObject是什么）
一.模块初识(一) 模块,也叫库.库有标准库第三方库. 注意事项:文件名不能和导入的模块名相同 1. sys模块 import sys print(sys.path) #打印环境变量 print(sy ...
python学习笔记之基础一（第一天）
1. python字符介绍在C语言中没有字符串,只有字符在python中的字符串hello,在C语言中是以字符数组在内存存放['h','e','l','l','o'],如果对字符串修改,则是在内存 ...
python学习笔记系列----（二）控制流
实际开始看这一章节的时候,觉得都不想看了,因为每种语言都会有控制流,感觉好像我不看就会了似的.快速预览的时候,发现了原来还包含了对函数定义的一些描述,重点讲了3种函数形参的定义方法,章节的最后讲述了P ...
Python学习笔记：基础
本文根据廖雪峰的博客,学习整理笔记.主要内容有:基本数据类型,容器数据类型,变量及其作用域,判断及循环语法,函数式编程,面向对象,模块等概念. 数据类型在python中,能够直接处理的数据类型有以下 ...
Python学习笔记day01--Python基础
1 python的应用 Python崇尚优美.清晰.简单,是一个优秀并广泛使用的语言. Python可以应用于众多领域,如:数据分析.组件集成.网络服务.图像处理.数值计算和科学计算等 ...

随机推荐

对接第三方支付接口-获取http中的返回参数
这几天对接第三方支付接口,在回调通知里获取返回参数,有一家返回的json格式,请求参数可以从标准输入流中获取. //1.解析参数 , 读取请求内容 BufferedReader br; String ...
mysql优化limit分页
调用CachedRowSetImpl类时出现错误
调用CachedRowSetImpl类时,出现以下错误: Access restriction: The type CachedRowSetImpl is not accessible due to ...
Spring boot学习一
SSM框架:Spring+SpringMVC+MyBatisSpring Boot一.pom文件:pom.xml中添加: <!--spring-boot-starter-web提供了对we ...
XML：使用DOM技术解析xML文件中的城市，实现select级联选择
中国的城市xml格式:cities.xml <?xml version="1.0" encoding="utf-8"?> <china> ...
k8s入门系列之guestbook快速部署
k8s集群以及一些扩展插件已经安装完毕,本篇文章介绍一下如何在k8s集群上快速部署guestbook应用. •实验环境为集群:master(1)+node(4),详细内容参考<k8s入门系列之集 ...
关于iOS和android自定义包的名字
自定义包名的使用,android的包名和ios的包名都是你的自定义包名!如下以新浪微博SDK自定义包名示例:(官方没的,自己踩过坑,方便后来人吧) 相关技术文档:http://www.apicloud ...
Issue 6: 装机系列1，PC下windows系统安装指南
0.前言接触电脑将近7年时间,多次说要写下这篇文章,一直未曾提笔,始终怕给人以误导.到如今,来来回回装系统的次数得超过百次了.本着不误导人的想法,本文试着总结一下装系统的基本方法和思路,但不会过多涉 ...
zookeeper清除事物日志
dataDir=/data/zookeeper/data dataLogDir=/data/zookeeper/log zk事物日志(快照)存放目录,高负荷工作的时候,会产生大量的日志,需 ...
MVC中的成员资格,授权,安全性
使用 Authorize 特性登录 Authorize 是 ASP.NET MVC 自带的默认授权过滤器, 可用来限制用户对操作方法的访问. 保护控制器操作 Authorize 特性在表单身份验证和 ...

python学习笔记之基础二（第二天）

python学习笔记之基础二（第二天）的更多相关文章

随机推荐

热门专题