Python强大的自省简析
1. 什么是自省?
自省就是自我评价、自我反省、自我批评、自我调控和自我教育,是孔子提出的一种自我道德修养的方法。他说:“见贤思齐焉,见不贤而内自省也。”(《论语·里仁》)当然,我们今天不是想说党员的批评与自我批评。表明意思上,自省(introspection)是一种自我检查行为。在计算机编程中,自省是指这种能力:检查某些事物以确定它是什么、它知道什么以及它能做什么。自省向程序员提供了极大的灵活性和控制力。
本文介绍了 Python 编程语言的自省能力。整个 Python 语言对自省提供了深入而广泛的支持。实际上,很难想象假如 Python 语言没有其自省特性是什么样子。
2. Python的help
在进入python的终端IDE时我们就能见到help的身影:
zhouyl@zhouyl:~/repository/blog/python$ python
Python 2.7.3 (default, Jan 2 2013, 16:53:07)
[GCC 4.7.2] on linux2
Type "help", "copyright", "credits" or "license" for more information.
最后一行清晰的提释我们可以输入help来获取更多的信息。
>>> help # 输入help之后,系统提示输入help()进入交互式的help界面,或者使用help(obj)来获取obj的help信息
Type help() for interactive help, or help(object) for help about object.
>>> help() # 输入help() Welcome to Python 2.7! This is the online help utility. If this is your first time using Python, you should definitely check out
the tutorial on the Internet at http://docs.python.org/2.7/tutorial/. Enter the name of any module, keyword, or topic to get help on writing
Python programs and using Python modules. To quit this help utility and
return to the interpreter, just type "quit". To get a list of available modules, keywords, or topics, type "modules",
"keywords", or "topics". Each module also comes with a one-line summary
of what it does; to list the modules whose summaries contain a given word
such as "spam", type "modules spam". help> # 在输入一段“说明”后,进入交互式help界面(Ctrl+C或者输入quit退出)
help> list # 输入list之后进入另一类似于“man”的窗口,完整介绍list help> keywords # 输入keywords只打印python的关键字列表 Here is a list of the Python keywords. Enter any keyword to get more help. and elif if print
as else import raise
assert except in return
break exec is try
class finally lambda while
continue for not with
def from or yield
del global pass help> if # 输入关键字if,也是类似于上面list在另一窗口下介绍if
当然,我们也可以在python的IDE下使用help(object)来获取某一对象的help信息,比如:
>>> help(os) # 想看os模块?^_^,没门,你还没加载呢
Traceback (most recent call last):
File "", line 1, in
NameError: name 'os' is not defined
>>> import os
>>> help(os) # 加载之后即可查看os的help信息了 >>>
3. sys 模块
对于sys模块,使用比较频繁见的也比较多,那么它是干吗的?python官网是这么介绍的:“System-specific parameters and functions”(系统特定的参数和函数)。所以sys 模块是提供关于 Python 本身的详尽内在信息的模块。通过导入模块,并用点(.)符号引用其内容(如变量、函数和类)来使用模块。 sys 模块包含各种变量和函数,它们揭示了当前的 Python 解释器有趣的详细信息。
platform 变量告诉我们现在处于什么操作系统上: sys.platform 属性
>>> import sys
>>> sys.platform
'linux2'
在当前的 Python 中,版本以字符串和元组(元组包含对象序列)来表示:
>>> sys.version
'2.7.3 (default, Jan 2 2013, 16:53:07) \n[GCC 4.7.2]'
>>> sys.version_info
sys.version_info(major=2, minor=7, micro=3, releaselevel='final', serial=0)
maxint 变量反映了可用的最大整数值: sys.maxint 属性
>>> sys.maxint
2147483647
argv 变量是一个包含命令行参数的列表(如果参数被指定的话)。第一项 argv[0] 是所运行脚本的路径。当我们以交互方式运行 Python 时,这个值是空字符串: sys.argv 属性
>>> sys.argv
['']
关于sys.argv的使用,我们在前面介绍函数的学习笔记中已有介绍,它可以用来接收函数的脚本,比如:
#!/usr/bin/python
import sys
print"The script name is "+sys.argv[0]
print"The first parameter is %s" % sys.argv[1]
print"The second parameter is %r" % sys.argv[2]
在脚本使用时,我们可以给脚本带入参数:
long@zhouyl:/tmp/test$ python arg.py 1 2 3 # 虽然程序中只要求打印前2个参数,但是我们也可以带更多的,只是没打印而已
The script name is arg.py
The first parameter is 1
The second parameter is '2'
path 变量是模块搜索路径,Python 在导入期间将在其中的目录列表中寻找模块。:sys.path 属性
>>> sys.path
['', '/home/pobrien/Code', # 最前面的空字符串 '' 是指当前目录
'/usr/local/lib/python2.2',
'/usr/local/lib/python2.2/plat-linux2',
'/usr/local/lib/python2.2/lib-tk',
'/usr/local/lib/python2.2/lib-dynload',
'/usr/local/lib/python2.2/site-packages']
modules 变量是一个字典,它将当前已装入的所有模块的名称映射到模块对象。如您所见,缺省情况下,Python 装入一些特定的模块: sys.modules 属性
>>> sys.modules
{'stat': <module 'stat'="" from="" '="" usr="" local="" lib="" python2.2="" stat.pyc'="">,
'__future__': <module '__future__'="" from="" '="" usr="" local="" lib="" python2.2="" __future__.pyc'="">,
'copy_reg': <module 'copy_reg'="" from="" '="" usr="" local="" lib="" python2.2="" copy_reg.pyc'="">,
'posixpath': <module 'posixpath'="" from="" '="" usr="" local="" lib="" python2.2="" posixpath.pyc'="">,
'UserDict': <module 'userdict'="" from="" '="" usr="" local="" lib="" python2.2="" userdict.pyc'="">,
'signal': <module 'signal'="" (built-in)="">,
'site': <module 'site'="" from="" '="" usr="" local="" lib="" python2.2="" site.pyc'="">,
'__builtin__': <module '__builtin__'="" (built-in)="">,
'sys': <module 'sys'="" (built-in)="">,
'posix': <module 'posix'="" (built-in)="">,
'types': <module 'types'="" from="" '="" usr="" local="" lib="" python2.2="" types.pyc'="">,
'__main__': <module '__main__'="" (built-in)="">,
'exceptions': <module 'exceptions'="" (built-in)="">,
'os': <module 'os'="" from="" '="" usr="" local="" lib="" python2.2="" os.pyc'="">,
'os.path': <module 'posixpath'="" from="" '="" usr="" local="" lib="" python2.2="" posixpath.pyc'="">}
4.中的自省模块
在阅读dive into python时,第四章讲到了自省,代码如下:
# apihelper.py
def info(object, spacing=10, collapse=1):
"""Print methods and doc strings. Takes module, class, list, dictionary, or string."""
methodList = [method for method in dir(object) if callable(getattr(object, method))]
processFunc = collapse and (lambda s: " ".join(s.split())) or (lambda s: s)
print "\n".join(["%s %s" %
(method.ljust(spacing),
processFunc(str(getattr(object, method).__doc__)))
for method in methodList])
使用起来也很方便,如下:
>>> from apihelper import info
>>> li = []
>>> info(li)
__add__ x.__add__(y) <==> x+y
__class__ list() -> new empty list list(iterable) -> new list initialized from iterable's items
...
>>> import apihelper
>>> info(apihelper)
info Print methods and doc strings. Takes module, class, list, dictionary, or string.
>>> info(apihelper,20)
info Print methods and doc strings. Takes module, class, list, dictionary, or string.
>>> info(apihelper,20,0)
info Print methods and doc strings. Takes module, class, list, dictionary, or string.
4.1. 几个内置函数介绍
其中使用了几个函数,主要介绍如下:
dir([obj]):
dir() 函数可能是 Python 自省机制中最著名的部分了。它返回传递给它的任何对象的属性名称经过排序的列表(会有一些特殊的属性不包含在内)。如果不指定对象,则 dir() 返回当前作用域中的名称(obj的默认值是当前的模块对象)。
eg.
>>> li
[1, 4, 8, 16, 2, 3]
>>> dir(li)
['__add__', '__class__', '__contains__', '__delattr__', '__delitem__', '__delslice__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__getslice__', '__gt__', '__hash__', '__iadd__', '__imul__', '__init__', '__iter__', '__le__', '__len__', '__lt__', '__mul__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__reversed__', '__rmul__', '__setattr__', '__setitem__', '__setslice__', '__sizeof__', '__str__', '__subclasshook__', 'append', 'count', 'extend', 'index', 'insert', 'pop', 'remove', 'reverse', 'sort']
getattr(obj, attr):
getattr是一个有用到无法置信的内置函数(自省的核心哦),可以返回任意对象的任何属性。调用这个方法将返回obj中名为attr值的属性的值,例如如果attr为'bar',则返回obj.bar。使用getattr函数,可以得到一个直到运行时才知道名称的函数的引用。getattr的返回值是方法,可以调用。
eg.
>>> li
[1, 4, 8, 16]
>>> li.append(2)
>>> li
[1, 4, 8, 16, 2]
>>> getattr(li,'append')(3)
>>> li
[1, 4, 8, 16, 2, 3]
类似还有:
hasattr(obj, attr):
这个方法用于检查obj是否有一个名为attr的值的属性,返回一个布尔值。
setattr(obj, attr, val):
调用这个方法将给obj的名为attr的值的属性赋值为val。例如如果attr为'bar',则相当于obj.bar = val。
callable(obj):
可以调用表示潜在行为(函数和方法)的对象。可以用 callable() 函数测试参数对象的可调用性,参数对象可调用返回True,否则返回False。
eg.
>>> li
[1, 2 , 4, 8, 16]
>>> callable(li)
False
>>> callable(li.append)
True
string.ljust(length):
ljust用空格填充字符串以符合指定的长度。如果指定的长度(length)小于字符串的长度(len(string)),ljust将简单滴返回未变化的字符串,不会截断字符串。
eg.
>>> s = "Zhou"
>>> print s.ljust(10)+"Hello"
Zhou Hello
>>> print s.ljust(1)+"Hello"
ZhouHello
4.2. 列表解析
Python有着强大的列表解析即将列表映射到其他列表的强大能力。列表解析同过滤机制结合使用,使列表中有些元素被映射而跳过其他元素。
列表解析:
[mapping-expression for item in source-list]
eg.
>>> li = [1,2,4,8,16]
>>> [item*2 for item in li]
[2, 4, 8, 16, 32]
过滤列表语法:
[mapping-expression for item in source-list if filter-expression]
eg.
>>> li = [1,2,4,8,16]
>>> [item*2 for item in li if item%2 == 0]
[4, 8, 16, 32]
如上所示,过滤列表就是列表解析的扩展,前三部分是相同的,最后一步分添加if开头的过滤表达式(过滤表达式可以是返回值为真或假的任何表达式,而在Python中几乎是任何东西)。
注意:如果仔细查看上面的apihelper.py实例,可以发现作者将一行命令放在多行,这也可以?这里可以告诉你的是“列表解析是可以一个表达式分割成多行的”,因为整个表达式都在一个方括号中括起来了。
4.3 逐析模块
对于上述模块中还有一些用法在上面两节中并没有提及。比如and-or用法和lambda函数,这些都在本系列的前文学习笔记中有所涉及,本文再不赘述。
下面对于上述模块逐句进行分析:
def info(object, spacing=10, collapse=1):
# 首先,我们可以看到,定义的函数使用了三个参数:
@ object -- 当然是我们想要查看的目标了,本函数使用dir获取object的属性,而又因dir函数的强大,所以此处的object可以是python中的任意东西,包括模块对象、函数对象、字符串对象、列表对象、字典对象...
@ spacing = 10,这里定义了一个关键参数,也就是说,如果调用info函数时没有给spacing赋值,spacing将使用默认的10。那么这个spacing是干吗的?向下看,对!没错它是给ljust做参数的!也就是说长度不足10的字符串会使用空格补气,而超过10的不做修改
@ collapse = 1,这里也定了一个关键参数,如果不赋值,使用默认值1。collapse在函数中用作and-or用法的判断语句。
"""Print methods and doc strings.
Takes module, class, list, dictionary, or string."""
# 这是什么?没错,当然是docstring了
methodList = [method for method in dir(object) if callable(getattr(object, method))]
# 使用上面介绍的过滤列表,首先使用dir对object解析获取object的所有属性的一个列表,使用列表解析对其进行映射并通过if对其进行过滤,过滤条件是object.method可调用!因此,最后得到的methodList是一个object的所有可调用的属性的列表
processFunc = collapse and (lambda s: " ".join(s.split())) or (lambda s: s)
# 这一句定义了一个函数,对,只有一行的lambda函数哦,并使用第三个参数作为and-or用法的判断。如果collapse为True,processFunc = lambda s: " ".join(s.split()),也即将s先使用split函数分割在使用" ".join将其使用空格连接起来。如果collapse为False,processFunc = lambda s: s,也即对s不做任何处理
print "\n".join(["%s %s" %
(method.ljust(spacing),
processFunc(str(getattr(object, method).__doc__)))
for method in methodList])
# 这里就是上面提到的将列表解析放在几行中使用的一个典型案例,首先使用method遍历methodList列表(上面获得的object的所有可调用的属性的列表),在使用processFunc对object.method的__doc__(docstring)进行处理,与使用ljust调整好的method名一同打印出来。并使用"\n".join将每个不同的method信息之间进行分割,分割在不同行打印。
5. 打印一些函数的可获取信息
下面是《Python 自省指南》中使用到的自省方法,主要使用了一些内置函数(id(),type(),repr()等)打印对象的信息:
def interrogate(item):
"""Print useful information about item."""
if hasattr(item, '__name__'):
print "NAME: ", item.__name__
if hasattr(item, '__class__'):
print "CLASS: ", item.__class__.__name__
print "ID: ", id(item)
print "TYPE: ", type(item)
print "VALUE: ", repr(item)
print "CALLABLE:",
if callable(item):
print "Yes"
else:
print "No"
if hasattr(item, '__doc__'):
doc = getattr(item, '__doc__')
doc = doc.strip() # Remove leading/trailing whitespace.
firstline = doc.split('\n')[0]
print "DOC: ", firstline
我们把它添加到apihelper模块中作为我们的自省模块的另一个方法,使用起来如下:
>>> import apihelper # 加载我们的apihelper
>>> apihelper.info(apihelper) # 调用前面的info函数查看apihelper中有哪些属性
info Print methods and doc strings. Takes module, class, list, dictionary, or string.
interrogate Print useful information about item.
>>> apihelper.interrogate(apihelper) # 使用interrogate查看我们的apihelper的信息
NAME: apihelper
CLASS: module
ID: 3075144100
TYPE: <type 'module'="">
VALUE: <module 'apihelper'="" from="" 'apihelper.py'="">
CALLABLE: No
Traceback (most recent call last):
File "", line 1, in
File "apihelper.py", line 30, in interrogate
doc = doc.strip() # Remove leading/trailing whitespace.
AttributeError: 'NoneType' object has no attribute 'strip'
>>> apihelper.interrogate(apihelper.info) # 查看apihelper.info信息
NAME: info
CLASS: function
ID: 3075150932
TYPE: <type 'function'="">
VALUE:
CALLABLE: Yes
DOC: Print methods and doc strings.
>>> apihelper.interrogate(123) # 查看整数的信息
CLASS: int
ID: 153002672
TYPE: <type 'int'="">
VALUE: 123
CALLABLE: No
DOC: int(x[, base]) -> integer
>>> apihelper.interrogate("Hello") # 查看字符串的信息
CLASS: str
ID: 3075198208
TYPE: <type 'str'="">
VALUE: 'Hello'
CALLABLE: No
DOC: str(object) -> string
至此,我们的自省模块apihelper也就有了比较强大的功能,其自省能力也是不错的~~~
Python强大的自省简析的更多相关文章
- python 学习笔记 9 -- Python强大的自省简析
1. 什么是自省? 自省就是自我评价.自我反省.自我批评.自我调控和自我教育,是孔子提出的一种自我道德修养的方法.他说:“见贤思齐焉,见不贤而内自省也.”(<论语·里仁>)当然,我们今天不 ...
- python __init__() 和__new__()简析
先看下面一个例子: 如上图,例1中,构造了函数Foo,并重写了__new__()和__init__()方法,在实例化Foo()的时候,却只调用了__new__() 例2中,在实例化Too()对象时,同 ...
- 功能强大的图片截取修剪神器:Android SimpleCropView及其实例代码重用简析(转)
功能强大的图片截取修剪神器:Android SimpleCropView及其实例代码重用简析 SimpleCropView是github上第一个第三方开源的图片修剪截取利器,功能强大,设计良好.我个人 ...
- [转载] Thrift原理简析(JAVA)
转载自http://shift-alt-ctrl.iteye.com/blog/1987416 Apache Thrift是一个跨语言的服务框架,本质上为RPC,同时具有序列化.发序列化机制:当我们开 ...
- 简析 __init__、__new__、__call__ 方法
简析 __init__.__new__.__call__ 方法 任何事物都有一个从创建,被使用,再到消亡的过程,在程序语言面向对象编程模型中,对象也有相似的命运:创建.初始化.使 用.垃圾回收,不同的 ...
- DiskGenius注册算法简析
初次接触DiskGenius已经成为遥远的记忆,那个时候还只有DOS版本.后来到Windows版,用它来处理过几个找回丢失分区的案例,方便实用.到现在它的功能越来越强大,成为喜好启动技术和桌面支持人员 ...
- 简析 Tomcat 、Nginx 与 Apache 的区别
简析 Tomcat .Nginx 与 Apache 的区别 本文讲的是简析 Tomcat .Nginx 与Apache的区别, 经常在用 apache 和 tomcat 等这些服务器,可是总感觉还是不 ...
- 痞子衡嵌入式:简析i.MXRT1170 Cortex-M4 L-MEM ECC功能特点、开启步骤、性能影响
大家好,我是痞子衡,是正经搞技术的痞子.今天痞子衡给大家分享的是恩智浦i.MXRT1170上Cortex-M4内核的L-MEM ECC功能. 本篇是 <简析i.MXRT1170 Cortex-M ...
- 简析.NET Core 以及与 .NET Framework的关系
简析.NET Core 以及与 .NET Framework的关系 一 .NET 的 Framework 们 二 .NET Core的到来 1. Runtime 2. Unified BCL 3. W ...
随机推荐
- 史上最详细SharePoint 2013安装步骤图解新手教程
来源:// http://www.itexamprep.com/cn/microsoft/soft/sharepoint2013/2013/0408/2866.html 文章就是SharePoint2 ...
- centos 设置删除提示
centos 设置删除.覆盖提示 相信好多用linux的同学都用过cp这个命令来覆盖文件,但是新建的普通用户不会有任何提示,这时候心里就咯噔一下,赶紧看看新文件的是不是传上去了.如果加上提示,是不是就 ...
- Python入门学习
1.访问www.python.org/download下载并安装Python3版本 2.命令行输入python启动交互式命令shell,>>>代表当前行用户的输入 3.基本算数运算: ...
- linux重要目录说明
1 home :root用户的home 目录是root,普通用户的home 目录是/home,users/(不要随便使用root权限,小白容易改错东西哒) 2 bin:常用可执行文件:/bin./us ...
- 使用MegaCli工具,在线调整raid配置
公司hadoop平台采购了一批浪潮服务器,2个系统盘,12个数据盘.先想的用直通的raid卡免得再做单盘raid0麻烦,结果这批机器配的卡也不支持裸盘使用,咨询浪潮客服,说可以使用JBOD的模式进行, ...
- handler消息机制
MessageQueue代码:http://grepcode.com/file_/repository.grepcode.com/java/ext/com.google.android/android ...
- 第八十六节,html5+css3pc端固定布局,网站结构,CSS选择器,完成导航
html5+css3pc端固定布局,网站结构,CSS选择器,完成导航 页面采用1280的最低宽度设计,去掉滚动条为1263像素. 项目是PC端的固定布局,会采用像素(px)单位. 网站结构语义 在没有 ...
- WEB前端组件思想【分页】
DEMO1: 很早就想写一些功能性的组件,无奈技术有限一点一点的边工作,边学. 近日工作中用到分页功能,当然由于加快业务进度,第一选择肯定是选择插件,但是实用性来说,还是有那么一点不适合.毕竟插件是通 ...
- hdu_2476_String painter(区间DP)
题目链接:hdu_2476_String painter 题意: 有a,b两字符串,现在你有一个刷子,每次可以任选一个区间,使这个区间变成你想要的字符,现在让你将a变成b,问最少刷多少次 题解: 考虑 ...
- hdu_5881_Tea(xjb猜)
题目链接:hdu_5881_Tea 题意: 有一壶水, 体积在 L 和 R 之间, 有两个杯子, 你要把水倒到两个杯子里面, 使得杯子水体积几乎相同(体积的差值小于等于1), 并且使得壶里剩下水体积不 ...