python项目实践一：即时标记

转自：http://www.code123.cc/1317.html

这是《python基础教程》后面的实践，照着写写，一方面是来熟悉python的代码方式，另一方面是练习使用python中的基本的以及非基本的语法，做到熟能生巧。

这个项目一开始比较简单，不过重构之后就有些复杂了，但是更灵活了。

按照书上所说，重构之后的程序，分为四个模块：处理程序模块，过滤器模块，规则（其实应该是处理规则），语法分析器。

先来说处理程序模块，这个模块的作用有两个，一个是提供那些固定的html标记的输出（每一个标记都有start和end），另一个是对这个标记输出的开始和结束提供了一个友好的访问接口。来看下程序handlers.py：

class Handler:

'''

def callback(self, prefix, name, *args):

method = getattr(self,prefix+name,None)

if callable(method): return method(*args)

def start(self, name):

self.callback('start_', name)

def end(self, name):

self.callback('end_', name)

def sub(self, name):

def substitution(match):

result = self.callback('sub_', name, match)

if result is None: match.group(0)

return result

return substitution

class HTMLRenderer(Handler):

'''

def start_document(self):

print '<html><head><title>...</title></head><body>'

def end_document(self):

print '</body></html>'

def start_paragraph(self):

print '<p>'

def end_paragraph(self):

print '</p>'

def start_heading(self):

print '<h2>'

def end_heading(self):

print '</h2>'

def start_list(self):

print '<ul>'

def end_list(self):

print '</ul>'

def start_listitem(self):

print '<li>'

def end_listitem(self):

print '</li>'

def start_title(self):

print '<h1>'

def end_title(self):

print '</h1>'

def sub_emphasis(self, match):

return '<em>%s</em>' % match.group(1)

def sub_url(self, match):

return '<a href="%s">%s</a>' % (match.group(1),match.group(1))

def sub_mail(self, match):

return '<a href="mailto:%s">%s</a>' % (match.group(1),match.group(1))

def feed(self, data):

print data

这个程序堪称是整个“项目”的基石所在：提供了标签的输出，以及字符串的替换。理解起来也比较简单。

再来看第二个模块“过滤器”，这个模块更为简单，其实就是一个正则表达式的字符串。相关代码如下：

self.addFilter(r'\*(.+?)\*', 'emphasis')

self.addFilter(r'(http://[\.a-z0-9A-Z/]+)', 'url')

self.addFilter(r'([\.a-zA-Z]+@[\.a-zA-Z]+[a-zA-Z]+)','mail')

这就是三个过滤器了，分别是：强调牌过滤器（用×号标出的），url牌过滤器，email牌过滤器。熟悉正则表达式的同学理解起来是没有压力的。

再来看第三个模块“规则”，这个模块，抛开那祖父类不说，其他类应该有的两个方法是condition和action，前者是用来判断读进来的字符串是不是符合自家规则，后者是用来执行操作的，所谓的执行操作就是指调用“处理程序模块”，输出前标签、内容、后标签。来看下这个模块的代码，其实这个里面几个类的关系，画到类图里面看会比较清晰。 rules.py:

class Rule:

def action(self, block, handler):

handler.start(self.type)

handler.feed(block)

handler.end(self.type)

return True

class HeadingRule(Rule):

type = 'heading'

def condition(self, block):

return not '\n' in block and len(block) <= 70 and not block[-1] == ':'

class TitleRule(HeadingRule):

type = 'title'

first = True

def condition(self, block):

if not self.first: return False

self.first = False

return HeadingRule.condition(self, block)

class ListItemRule(Rule):

type = 'listitem'

def condition(self, block):

return block[0] == '-'

def action(self,block,handler):

handler.start(self.type)

handler.feed(block[1:].strip())

handler.end(self.type)

return True

class ListRule(ListItemRule):

type = 'list'

inside = False

def condition(self, block):

return True

def action(self,block, handler):

if not self.inside and ListItemRule.condition(self,block):

handler.start(self.type)

self.inside = True

elif self.inside and not ListItemRule.condition(self,block):

handler.end(self.type)

self.inside = False

return False

class ParagraphRule(Rule):

type = 'paragraph'

def condition(self, block):

return True

补充utils.py:

def line(file):

for line in file:yield line

yield '\n'

def blocks(file):

block = []

for line in lines(file):

if line.strip():

block.append(line)

elif block:

yield ''.join(block).strip()

block = []

最后隆重的来看下“语法分析器模块”，这个模块的作用其实就是协调读入的文本和其他模块的关系。在往重点说就是，提供了两个存放“规则”和“过滤器”的列表，这么做的好处就是使得整个程序的灵活性得到了极大的提高，使得规则和过滤器变成的热插拔的方式，当然这个也归功于前面在写规则和过滤器时每一种类型的规则（过滤器）都单独的写成了一个类，而不是用if..else来区分。看代码：

import sys, re

from handlers import *

from util import *

from rules import *

class Parser:

def __init__(self,handler):

self.handler = handler

self.rules = []

self.filters = []

def addRule(self, rule):

self.rules.append(rule)

def addFilter(self,pattern,name):

def filter(block, handler):

return re.sub(pattern, handler.sub(name),block)

self.filters.append(filter)

def parse(self, file):

self.handler.start('document')

for block in blocks(file):

for filter in self.filters:

block = filter(block, self.handler)

for rule in self.rules:

if rule.condition(block):

last = rule.action(block, self.handler)

if last:break

self.handler.end('document')

class BasicTextParser(Parser):

def __init__(self,handler):

Parser.__init__(self,handler)

self.addRule(ListRule())

self.addRule(ListItemRule())

self.addRule(TitleRule())

self.addRule(HeadingRule())

self.addRule(ParagraphRule())

self.addFilter(r'\*(.+?)\*', 'emphasis')

self.addFilter(r'(http://[\.a-z0-9A-Z/]+)', 'url')

self.addFilter(r'([\.a-zA-Z]+@[\.a-zA-Z]+[a-zA-Z]+)','mail')

handler = HTMLRenderer()

parser = BasicTextParser(handler)

parser.parse(sys.stdin)

这个模块里面的处理思路是，遍历客户端（也就是程序执行的入口）给插进去的所有的规则和过滤器，来处理读进来的文本。

有一个细节的地方也要说一下，其实是和前面写的呼应一下，就是在遍历规则的时候通过调用condition这个东西来判断是否符合当前规则。

我觉得这个程序很像是命令行模式，有空可以复习一下该模式，以保持记忆网节点的牢固性。

最后说一下我以为的这个程序的用途， 1、用来做代码高亮分析，如果改写成js版的话，可以做一个在线代码编辑器。 2、可以用来学习，供我写博文用。

还有其他的思路，可以留下您的真知灼见。

补充一个类图，很简陋，但是应该能说明之间的关系。另外我还是建议如果看代码捋不清关系最好自己画图，自己画图才能熟悉整个结构。

python项目实践一：即时标记的更多相关文章

python基础教程笔记—即时标记（详解）
最近一直在学习python,语法部分差不多看完了,想写一写python基础教程后面的第一个项目.因为我在网上看到的别人的博客讲解都并不是特别详细,仅仅是贴一下代码,书上内容照搬一下,对于当时刚学习py ...
python基础教程2第20章项目1：即时标记
simple_markup.py import sys, re from util import * print('<html><head><title>...&l ...
Python 项目实践一（外星人入侵）第一篇
python断断续续的学了一段实践,基础课程终于看完了,现在跟着做三个小项目,第一个是外星人入侵的小游戏: 一 Pygame pygame 是一组功能强大而有趣的模块,可用于管理图形,动画乃至声音,让 ...
Python 项目实践二（生成数据）第二篇之随机漫步
接着上节继续学习,在本节中,我们将使用Python来生成随机漫步数据,再使用matplotlib以引人瞩目的方式将这些数据呈现出来.随机漫步是这样行走得到的路径:每次行走都完全是随机的,没有明确的方向 ...
Python 项目实践三（Web应用程序）第一篇
一 Djangao入门当今的网站实际上都是富应用程序(rich application),就像成熟的桌面应用程序一样.Python提供了一组开发Web应用程序的卓越工具.在本章中,你将学习如何使用D ...
Python 项目实践三（Web应用程序）第二篇
接着上节的继续学习,使用Django创建网页的过程通常分三个阶段:定义URL.编写视图和编写模板.首先,你必须定义URL模式,每个URL都被映射到特定的视图--视图函数获取并处理网页所需的数据.视图函 ...
Python 项目实践三（Web应用程序）第五篇
接着上节继续学习,在这一节,我们将建立一个用户注册和身份验证系统,让用户能够注册账户,进而登录和注销.我们将创建一个新的应用程序,其中包含与处理用户账户相关的所有功能.我们还将对模型Topic稍做修改 ...
Python 项目实践二（生成数据）第二篇
接着上节继续学习,在本节中,我们将使用Python来生成随机漫步数据,再使用matplotlib以引人瞩目的方式将这些数据呈现出来.随机漫步是这样行走得到的路径:每次行走都完全是随机的,没有明确的方向 ...
Python 项目实践一（外星人入侵）第二篇
接着上次的继续学习. 一创建一个设置类每次给游戏添加新功能时,通常也将引入一些新设置.下面来编写一个名为settings的模块,其中包含一个名为Settings的类,用于将所有设置存储在一个地方, ...

随机推荐

java数据传递例子+内存分析
一.引用传递 1.例子1 package com.jikexueyuan.ref; class Ref1{ int temp = 10; } public class RefDemo01 { publ ...
css全局样式
@charset"utf-8"; *{margin:0;padding:0;} //去默认内外边距的简易写法 body,div,dl,dt,dd,ul,ol,li,h1,h2, ...
mvc ajax提交数组参数(转)
http://blog.csdn.net/lonestar555/article/details/10192595/ 在action中的参数以数组方式接收数据一.表单方式 1.提交Form < ...
SpringMVC 自动封装枚举类的方法
springmvc默认无法自动封装枚举类,解决方法如下: 1.枚举类 public enum GoodsPromoteEnum { /** * 0 精品 */ fine("精品", ...
IP地址
if (!/^(\d{1,2}|1\d\d|2[0-4]\d|25[0-5])(\.(\d{1,2}|1\d\d|2[0-4]\d|25[0-5])){3}$/.test($.trim($('#add ...
E1、T1链路
北美的24路脉码调制PCM简称T1 速率是1.544Mbit/s 北美使用的T1系统共有24个话路,每个话路采样脉冲用7bit编码,然后再加上1位信令码元,因此一个话路占用8bit. 帧同步码是在24 ...
配置SSH框架的心得
开发工具为myeclipse,开发工具自带struts2,hibernate,spring框架的导入.在新建的项目上右击Myeclipse->Project Facets->Install ...
iOS开发 GET、POST请求方法（NSURLSession篇）
NSURLConnection,在iOS9被宣布弃用,本文不使用NSURLConnection进行网络编程,有兴趣的童鞋可以参考: [iOS开发 GET.POST请求方法(NSURLConnectio ...
JAVA 常用框架和工具
集成开发工具(IDE):Eclipse.MyEclipse.Spring Tool Suite(STS).Intellij IDEA.NetBeans.JBuilder.JCreator JAVA服务 ...
leetcode-【中等题】228. Summary Ranges
题目: 228. Summary Ranges Given a sorted integer array without duplicates, return the summary of its r ...

python项目实践一：即时标记

python项目实践一：即时标记的更多相关文章

随机推荐

热门专题