Python学习摘录(下)
常用内建模块
1:collections模块:集合模块,提供了许多有用的集合类。
namedtuple
namedtuple
是一个函数,它用来创建一个自定义的tuple
对象,并且规定了tuple
元素的个数,并可以用属性而不是索引来引用tuple
的某个元素。
这样一来,我们用namedtuple
可以很方便地定义一种数据类型,它具备tuple的不变性,又可以根据属性来引用,使用十分方便。
- >>> from collections import namedtuple
- >>> Point = namedtuple('Point', ['x', 'y'])
- >>> p = Point(1, 2)
- >>> p.x
- 1
- >>> p.y
- 2
deque:为了高效实现插入和删除操作的双向列表,适合用于队列和栈。
deque
除了实现list的append()
和pop()
外,还支持appendleft()
和popleft()
,这样就可以非常高效地往头部添加或删除元素。
- >>> from collections import deque
- >>> q = deque(['a', 'b', 'c'])
- >>> q.append('x')
- >>> q.appendleft('y')
defaultdict:使用dict
时,如果引用的Key不存在,就会抛出KeyError
。如果希望key不存在时,返回一个默认值,就可以用defaultdict
- dd = defaultdict(lambda: 'N/A')
- dd['key2'] # key2不存在,返回默认值 'N/A'
OrderedDict:保持Key的顺序,OrderedDict
的Key会按照插入的顺序排列,不是Key本身排序。
- od = OrderedDict([('a', 1), ('b', 2), ('c', 3)])
- >>> od # OrderedDict的Key是有序的
- OrderedDict([('a', 1), ('b', 2), ('c', 3)])
Counter:一个简单的计数器。
统计字符出现的个数:
- >>> from collections import Counter
- >>> c = Counter()
- >>> for ch in 'programming':
- ... c[ch] = c[ch] + 1
2:hashlib
Python的hashlib提供了常见的摘要(散列)算法,如MD5,SHA1等等。
它通过一个函数,把任意长度的数据转换为一个长度固定的数据串(通常用16进制的字符串表示)。
md5使用:
- import hashlib
- md5 = hashlib.md5()//创建md5实例
- md5.update('how to use md5 in python hashlib?')//使用md5对字符串加密
- print md5.hexdigest()//得到md5加密后的字符串
sha1使用:
- import hashlib
- sha1 = hashlib.sha1()//创建sha1实例
- sha1.update('how to use sha1 in ')//加密
- print sha1.hexdigest()//获取加密后字符串
摘要算法的正确使用:使用唯一性内容+需要加密的内容+混淆性内容 作为数据库存储的内容。
通过对原始口令加一个复杂字符串,俗称“加盐”。但是如果加密内容一致,加盐又一致,则会出现相同的存储内容。所以在此基础上再加上唯一性的内容,比如用户名。
- db[username] = get_md5(password + username + 'the-Salt')
3:itertools
Python的内建模块itertools
提供了非常有用的用于操作迭代对象的函数。
几个“无限”迭代器:
count(n)
会创建一个无限的迭代器,从n开始一直迭代下去,永不停止。
cycle(str)
会把传入的一个序列无限重复迭代下去。
repeat(char,num)
负责把一个元素无限重复下去,不过如果提供第二个参数就可以限定重复次数
无限序列虽然可以无限迭代下去,但是通常我们会通过takewhile()
等函数根据条件判断来截取出一个有限的序列:
- >>> natuals = itertools.count(1)//创建一个无限迭代器
- >>> ns = itertools.takewhile(lambda x: x <= 10, natuals)//遍历无限迭代器的内容,从中提取符合lambda表达式的内容
操作迭代器的几个函数:
chain()
可以把一组迭代对象串联起来,形成一个更大的迭代器:
- for c in itertools.chain('ABC', 'XYZ'):
- print c
- # 迭代效果:'A' 'B' 'C' 'X' 'Y' 'Z'
groupby()
把迭代器中相邻的重复元素挑出来放在一起。
imap()
可以作用于无穷序列,并且,如果两个序列的长度不一致,以短的那个为准。当你调用imap()
时,并没有进行任何计算,必须用for
循环对r
进行迭代,才会在每次循环过程中计算出下一个元素。
同理,ifilter()
就是filter()
的惰性实现。
4:XML操作模块
操作XML有两种方法:DOM和SAX。DOM会把整个XML读入内存,解析为树,因此占用内存大,解析慢,优点是可以任意遍历树的节点。SAX是流模式,边读边解析,占用内存小,解析快,缺点是我们需要自己处理事件。
正常情况下,优先考虑SAX,因为DOM实在太占内存。
在Python中使用SAX解析XML非常简洁,通常我们关心的事件是start_element
,end_element
和char_data
,准备好这3个函数,然后就可以解析xml了。
- from xml.parsers.expat import ParserCreate
- #定义三个事件
- class DefaultSaxHandler(object):
- def start_element(self, name, attrs):
- print('sax:start_element: %s, attrs: %s' % (name, str(attrs)))
- def end_element(self, name):
- print('sax:end_element: %s' % name)
- def char_data(self, text):
- print('sax:char_data: %s' % text)
- xml = r'''<?xml version="1.0"?>
- <ol>
- <li><a href="/python">Python</a></li>
- <li><a href="/ruby">Ruby</a></li>
- </ol>
- '''
- handler = DefaultSaxHandler()
- parser = ParserCreate()
- parser.returns_unicode = True
- parser.StartElementHandler = handler.start_element
- parser.EndElementHandler = handler.end_element
- parser.CharacterDataHandler = handler.char_data
- parser.Parse(xml)
如何生成XML呢?最简单也是最有效的生成XML的方法是拼接字符串:
- L = []
- L.append(r'<?xml version="1.0"?>')
- L.append(r'<root>')
- L.append(encode('some & data'))
- L.append(r'</root>')
- return ''.join(L)
5:HTMLParser
如何解析HTML呢?
- from HTMLParser import HTMLParser
- from htmlentitydefs import name2codepoint
- class MyHTMLParser(HTMLParser):
- def handle_starttag(self, tag, attrs):
- print('<%s>' % tag)
- def handle_endtag(self, tag):
- print('</%s>' % tag)
- def handle_startendtag(self, tag, attrs):
- print('<%s/>' % tag)
- def handle_data(self, data):
- print('data')
- def handle_comment(self, data):
- print('<!-- -->')
- def handle_entityref(self, name):
- print('&%s;' % name)
- def handle_charref(self, name):
- print('&#%s;' % name)
6:强大的第三方图形处理模块——PIL
首先,要安装PIL。
然后,就行import相关模块,调用模块内的函数进行图形处理了。
网络编程
TCP/IP——Socket通信
1:客户端通信
- # 导入socket库:
- import socket
- # 创建一个socket:
- s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
- # 建立连接:
- s.connect(('域名', 端口))
- #发送数据
s.send('内容')
# 每次最多接收1k字节:
d = s.recv(1024)
# 关闭连接:
s.close()
创建Socket
时,AF_INET
指定使用IPv4协议,如果要用更先进的IPv6,就指定为AF_INET6
。SOCK_STREAM
指定使用面向流的TCP协议。
2:服务端通信
- #首先,创建一个基于IPv4和TCP协议的Socket:
- s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
- #然后绑定监听的地址和端口
- # 监听端口:
- s.bind(('IP地址',端口))
- #调用listen()方法开始监听端口,传入最大监听数
- s.listen(5)
- #通过一个永久循环来接受来自客户端的连接,accept()会等待并返回一个客户端的连接
- while True:
- # 接受一个新连接:
- sock, addr = s.accept() #accept方法返回一个含有两个元素的元组(connection,address)
- # 创建新线程来处理TCP连接:
- t = threading.Thread(target=任务函数, args=(sock, addr))
- t.start()
- data = sock.recv(1024)#接收内容
- sock.send('Hello, %s!' % data)#发回内容
- sock.close() #关闭socket
UDP编程
使用UDP协议时,不需要建立连接,只需要知道对方的IP地址和端口号,就可以直接发数据包。
服务端
- #创建服务端socket
- s = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)#SOCK_DGRAM指定了这个Socket的类型是UDP
- # 绑定端口:
- s.bind(('127.0.0.1', 9999))
- #无需监听端口,直接接收来自任何客户端的数据
- while True:
- # 接收数据:recvfrom()方法返回数据和客户端的地址与端口,这样,服务器收到数据后,直接调用sendto()就可以把数据用UDP发给客户端。
- data, addr = s.recvfrom(1024)
- print 'Received from %s:%s.' % addr
- s.sendto('Hello, %s!' % data, addr)
客户端
不需要调用connect()
,直接通过sendto()
给服务器发数据。
- #创建socket
- s = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)
- for data in ['Michael', 'Tracy', 'Sarah']
- # 发送数据
- s.sendto(data, ('服务器IP',端口))
- # 接收数据
- print s.recv(1024)
- s.close()
数据库
操作Mysql:
- # 导入MySQL驱动
- >>> import mysql.connector
- >>> conn = mysql.connector.connect(user='数据库账户', password='密码', database='数据库名', use_unicode=True)
- >>> cursor = conn.cursor()//创建一个游标
- # 创建user表
- >>> cursor.execute('create table user (id varchar(20) primary key, name varchar(20))')//执行SQL语句
- # 插入一行记录,注意MySQL的占位符是%s:
- >>> cursor.execute('insert into user (id, name) values (%s, %s)', ['', 'Michael'])
- >>> cursor.rowcount //获取语句执行结果
- 1
- # 提交事务:
- >>> conn.commit()
- >>> cursor.close()
- # 运行查询:
- >>> cursor = conn.cursor()
- >>> cursor.execute('select * from user where id = %s', ('',))
- >>> values = cursor.fetchall()//查询所有
- >>> values
- [(u'', u'Michael')]
- # 关闭Cursor和Connection:
- >>> cursor.close()
- True
- >>> conn.close()
Python中的ORM框架:SQLAlchemy
- # 导入:
- from sqlalchemy import Column, String, create_engine
- from sqlalchemy.orm import sessionmaker
- from sqlalchemy.ext.declarative import declarative_base
- # 创建对象的基类:
- Base = declarative_base()
- # 定义User对象:
- class User(Base):
- # 表的名字:
- __tablename__ = 'user'
- # 表的结构:
- id = Column(String(20), primary_key=True)
- name = Column(String(20))
- # 初始化数据库连接:
- engine = create_engine('mysql+mysqlconnector://root:password@localhost:3306/test')
- # 创建DBSession类型:
- DBSession = sessionmaker(bind=engine)
- # 创建session对象:
- session = DBSession()
- # 创建新User对象:
- new_user = User(id='', name='Bob')
- # 添加到session:
- session.add(new_user)
- # 提交即保存到数据库:
- session.commit()
- # 关闭session:
- session.close()
- # 创建Session:
- session = DBSession()
- # 创建Query查询,filter是where条件,最后调用one()返回唯一行,如果调用all()则返回所有行:
- user = session.query(User).filter(User.id=='').one()
- # 打印类型和对象的name属性:
- print 'type:', type(user)
- print 'name:', user.name
- # 关闭Session:
- session.close()
Web开发
PythonWeb提供了一套接口:WSGI:Web Server Gateway Interface。它只要求Web开发者实现一个函数,就可以响应HTTP请求。
函数接收两个参数:
environ:一个包含所有HTTP请求信息的
dict
对象;start_response:一个发送HTTP响应的函数。
start_response()
函数接收两个参数,一个是HTTP响应码,一个是一组list
表示的HTTP Header,每个Header用一个包含两个str
的tuple
表示。
使用web框架
除了Flask,常见的Python Web框架还有:
Python学习摘录(下)的更多相关文章
- 《转》python学习--基础下
转自http://www.cnblogs.com/BeginMan/archive/2013/04/12/3016323.html 一.数字 在看<Python 核心编程>的时候,我就有点 ...
- Python学习---Django下的Sql性能的测试
安装django-debug-tools Python学习---django-debug-tools安装 性能测试: settings.py INSTALLED_APPS = [ ... 'app01 ...
- Python学习---django下的cookie操作 180201
什么是Cookies 什么是Cookies cookies设置的原因: 1. http请求的无记忆性: 2.加快访问速度 3. 减少服务器压力 cookies特点: cookies保存在客户端浏览器 ...
- python学习--Linux下dlib安装(主要是cmake和boost的安装)
昨天我们使用了dlib和opencv进行了人脸检测标注(http://www.cnblogs.com/take-fetter/p/8310298.html) 但是运行环境是基于windows的而且可能 ...
- Python学习摘录(上)
1:接收输入 var=raw_input() 注意:raw_input()总数接收字符串形式的输入.所以,如果我们想接收其他类型的数据,则需要强制类型转换.(如果转换失败,就会抛出异常) 2:pass ...
- python学习:Windows 下 Python easy_install 的安装
Windows 下 Python easy_install 的安装 下载安装python安装工具下载地址:http://pypi.python.org/pypi/setuptools 可以找到 ...
- Python学习---django下的Session操作 180205
和Cookie一样,都是用来进行用户认证.不同的是,Cookie可以吧明文/密文的信息都会KV返回给客户段,但是session可以吧用户的Value[敏感信息]保存在服务器端,安全. Django中默 ...
- Python学习基础笔记(全)
换博客了,还是csdn好一些. Python学习基础笔记 1.Python学习-linux下Python3的安装 2.Python学习-数据类型.运算符.条件语句 3.Python学习-循环语句 4. ...
- Python学习---Python下[元组]的学习
元组是不可变的, 用小括号()定义,而且一旦定义 ,不可变[类型是tuple] [元组看做一个整体,不可拆分,不可赋值,但可以全部重新赋值] 通过圆括号,用逗号分隔,常用在使语句或用户定义的函数能够安 ...
随机推荐
- 利用ViewStub来延迟加载视图
很多情况下,我们的视图可能会随着用户的操作的不同而变化,比如一个新的页面包含多个控件,但仅仅在用户点击这个按钮后,所有的控件才能完全显示.也就是说一上来可能就显示一个控件,点击按钮后把其他隐藏的控件再 ...
- 如何选择JAVA培训机构,兼议什么样的人适合培训机构
首先,利益相关,本人就是培训机构创办者兼讲师,但这不妨碍我对此发表看法. 我们先来看什么样的人适合培训机构?要回答这个问题,需要先换个角度.这个角度就是,你学习一门语言的动机是什么?99%的人的回答是 ...
- SVG渲染顺序及z轴显示问题(zIndex)
SVG是严格按照定义元素的顺序来渲染的,这个与HTML靠z-index值来控制分层不一样. 在SVG中,写在前面的元素先被渲染,写在后面的元素后被渲染.后渲染的元素会覆盖前面的元素,虽然有时候受透明度 ...
- Java命令学习系列(四)——jstat
jstat(JVM Statistics Monitoring Tool)是用于监控虚拟机各种运行状态信息的命令行工具.他可以显示本地或远程虚拟机进程中的类装载.内存.垃圾收集.JIT编译等运行数据, ...
- [转]CENTOS LINUX安装并使用NFS共享文件
FROM :http://www.qiansw.com/centos-linux-nfs.html NFS是linux常用的一种文件分享工具. 下面介绍安装及使用方法. CentOS 5.5 yum ...
- Guava CaseFormat
概述 CaseFormat用来转换各种不同的编程语言间的变量名命名格式, 主要用到的方法只有一个 CaseFormat.to(CaseFormat from, String s) CaseFormat ...
- 【已解决】Android微信开放平台,申请移动应用的 应用签名 如何获取
在微信开放平台,申请移动应用的时候: https://open.weixin.qq.com/cgi-bin/appcreate?t=manage/createMobile&type=app&a ...
- vim粘贴代码的时候,恶心的缩进.
vim粘贴代码 如果有注释,那么粘贴后就惨不忍睹,类似于: 我粘贴代码到a.cpp,内容为: //打印函数 ) { ;i<length;i++){ ){ printf("0x &quo ...
- Pitch,Yaw,Roll的概念
在航空中,pitch, yaw, roll下图所示. pitch是围绕X轴旋转,也叫做俯仰角. yaw是围绕Y轴旋转,也叫偏航角. roll是围绕Z轴旋转,也叫翻滚角. 在3D系统中,假设视点 ...
- @Autowired用法详解
@Autowired 注释,它可以对类成员变量.方法及构造函数进行标注,完成自动装配的工作. 通过 @Autowired的使用来消除 set ,get方法.在使用@Autowired之前,我们对一个b ...