python开发_html

'''

   python中，html模块提供了只提供了一个方法：

   html.escape(s, quote = True)

       该方法主要是把html文件中的特殊字符(&,<,>,",'等)转换为HTML-safe字符

'''

下面是我做的一个demo：

运行效果：

Python 3.3.2 (v3.3.2:d047928ae3f6, May 16 2013, 00:03:43) [MSC v.1600 32 bit (Intel)] on win32

Type "copyright", "credits" or "license()" for more information.

>>> ================================ RESTART ================================

>>>

源html文件:

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">

<html>

 <head>

  <title> Python Html module </title>

  <meta name="Generator" content="EditPlus">

  <meta name="Author" content="Hongten">

  <meta name="Keywords" content="hongten,python">

  <meta name="Description" content="this blogs is about python">

 </head>

 <body>

    <table border = "">

        <tr>

            <td>

            Author

            </td>

            <td>

            Hongten

            </td>

            <td>

            Mail

            </td>

            <td>

            hongtenzone@foxmail.com

            </td>

        </tr>

        <tr>

            <td>

            Blos

            </td>

            <td>

            <a href="http://www.blogs.com/hongten">http://www.blogs.com/hongten</a>

            </td>

            <td>

            QQ

            </td>

            <td>

            648719819

            </td>

        </tr>

    </table>

 </body>

</html>

##################################################

转换html文件:

&lt;!DOCTYPE HTML PUBLIC &quot;-//W3C//DTD HTML 4.01 Transitional//EN&quot; &quot;http://www.w3.org/TR/html4/loose.dtd&quot;&gt;

&lt;html&gt;

 &lt;head&gt;

  &lt;title&gt; Python Html module &lt;/title&gt;

  &lt;meta name=&quot;Generator&quot; content=&quot;EditPlus&quot;&gt;

  &lt;meta name=&quot;Author&quot; content=&quot;Hongten&quot;&gt;

  &lt;meta name=&quot;Keywords&quot; content=&quot;hongten,python&quot;&gt;

  &lt;meta name=&quot;Description&quot; content=&quot;this blogs is about python&quot;&gt;

 &lt;/head&gt;

 &lt;body&gt;

    &lt;table border = &quot;1&quot;&gt;

        &lt;tr&gt;

            &lt;td&gt;

            Author

            &lt;/td&gt;

            &lt;td&gt;

            Hongten

            &lt;/td&gt;

            &lt;td&gt;

            Mail

            &lt;/td&gt;

            &lt;td&gt;

            hongtenzone@foxmail.com

            &lt;/td&gt;

        &lt;/tr&gt;

        &lt;tr&gt;

            &lt;td&gt;

            Blos

            &lt;/td&gt;

            &lt;td&gt;

            &lt;a href=&quot;http://www.blogs.com/hongten&quot;&gt;http://www.blogs.com/hongten&lt;/a&gt;

            &lt;/td&gt;

            &lt;td&gt;

            QQ

            &lt;/td&gt;

            &lt;td&gt;

            648719819

            &lt;/td&gt;

        &lt;/tr&gt;

    &lt;/table&gt;

 &lt;/body&gt;

&lt;/html&gt;

>>>

经过源文件内容和转换后的内容相比较，我想你知道html.escape()方法的作用了吧

================================================

代码部分：

================================================

 #python html

 #Author  : Hongten

 #Mailto  : hongtenzone@foxmail.com

 #Blog    : http://www.cnblogs.com/hongten

 #QQ      : 648719819

 #Create  ： 2013-08-26

 #Version : 1.0

 import html

 '''

    python中，html模块提供了只提供了一个方法：

    html.escape(s, quote = True)

        该方法主要是把html文件中的特殊字符(&,<,>,",'等)转换为HTML-safe字符

 '''

 #global var

 #html源文件内容

 HTML_STR = ''

 def html_escape(html_str):

     '''转换特殊字符'''

     return html.escape(html_str)

 def init():

     global HTML_STR

     HTML_STR = '''

 <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">

 <html>

  <head>

   <title> Python Html module </title>

   <meta name="Generator" content="EditPlus">

   <meta name="Author" content="Hongten">

   <meta name="Keywords" content="hongten,python">

   <meta name="Description" content="this blogs is about python">

  </head>

  <body>

     <table border = "1">

         <tr>

             <td>

             Author

             </td>

             <td>

             Hongten

             </td>

             <td>

             Mail

             </td>

             <td>

             hongtenzone@foxmail.com

             </td>

         </tr>

         <tr>

             <td>

             Blos

             </td>

             <td>

             <a href="http://www.blogs.com/hongten">http://www.blogs.com/hongten</a>

             </td>

             <td>

             QQ

             </td>

             <td>

             648719819

             </td>

         </tr>

     </table>

  </body>

 </html>

     '''

 def main():

     init()

     print('源html文件:{}'.format(HTML_STR))

     print('#' * 50)

     old_str = html_escape(HTML_STR)

     print('转换html文件:{}'.format(old_str))

 if __name__ == '__main__':

     main()

python开发_html_html处理的更多相关文章

python开发环境搭建
虽然网上有很多python开发环境搭建的文章,不过重复造轮子还是要的,记录一下过程,方便自己以后配置,也方便正在学习中的同事配置他们的环境. 1.准备好安装包 1)上python官网下载python运 ...
【Machine Learning】Python开发工具：Anaconda+Sublime
Python开发工具:Anaconda+Sublime 作者:白宁超 2016年12月23日21:24:51 摘要:随着机器学习和深度学习的热潮,各种图书层出不穷.然而多数是基础理论知识介绍,缺乏实现 ...
Python开发工具PyCharm个性化设置(图解)
Python开发工具PyCharm个性化设置,包括设置默认PyCharm解析器.设置缩进符为制表符.设置IDE皮肤主题等,大家参考使用吧. JetBrains PyCharm Pro 4.5.3 中文 ...
Python黑帽编程1.2 基于VS Code构建Python开发环境
Python黑帽编程1.2 基于VS Code构建Python开发环境 0.1 本系列教程说明本系列教程,采用的大纲母本为<Understanding Network Hacks Atta ...
Eclipse中Python开发环境搭建
Eclipse中Python开发环境搭建目录 1.背景介绍 2.Python安装 3.插件PyDev安装 4.测试Demo演示一.背景介绍 Eclipse是一款基于Java的可扩展开发平台. ...
Python开发：环境搭建（python3、PyCharm）
Python开发:环境搭建(python3.PyCharm) python3版本安装 PyCharm使用(完全图解(最新经典))
Python 开发轻量级爬虫08
Python 开发轻量级爬虫 (imooc总结08--爬虫实例--分析目标) 怎么开发一个爬虫?开发一个爬虫包含哪些步骤呢? 1.确定要抓取得目标,即抓取哪些网站的哪些网页的哪部分数据. 本实例确定抓 ...
Python 开发轻量级爬虫07
Python 开发轻量级爬虫 (imooc总结07--网页解析器BeautifulSoup) BeautifulSoup下载和安装使用pip install 安装:在命令行cmd之后输入,pip i ...
Python 开发轻量级爬虫06
Python 开发轻量级爬虫 (imooc总结06--网页解析器) 介绍网页解析器将互联网的网页获取到本地以后,我们需要对它们进行解析才能够提取出我们需要的内容. 也就是说网页解析器是从网页中提取有 ...

随机推荐

Remove K Digits
Given string A representative a positive integer which has N digits, remove any k digits of the numb ...
实现checkebox全选取消操作
方法一: javascript代码: function checkedChild(obj,index){ var checkBoxs = document.getElementsByName(&quo ...
06 Frequently Asked Questions (FAQ) 常见问题解答 (常见问题)
Frequently Asked Questions (FAQ) Origins 起源 What is the purpose of the project? What is the history ...
idea添加jdbc包
IDEA版本:IDEA 14 这里我使用的第三方jar包是数据库的JDBC jar包导出案例. 1.创建一个Module,名称为dataBase,在里面我们先创建一个folder用来包含所需要的jar ...
MySQL基础 - Navicat及HeidiSQL可视化数据库管理工具
你还在使用终端界面查看数据库吗?是的,用来用去还是觉得命令行好用.....这里先留个位子,改天再介绍下这俩工具的使用,虽然好像觉得没啥需要介绍的.
JavaSE简单实现多线程聊天
1.1 主程序入口在主程序入口处,通过设置MyWindow的第一个参数,如果为true则为服务器,如果为false,则为客户端,当然也可以设置第二个参数,区分客户端和服务器的窗口标题. public ...
python类、类继承
yield: 简单地讲,yield 的作用就是把一个函数变成一个 generator,带有 yield 的函数不再是一个普通函数,Python 解释器会将其视为一个 generator,调用 fab( ...
CodeIgniter典型的表单提交验证代码
view内容: <?php echo form_open('user/reg'); ?> <h5>用户名</h5> <input type="tex ...
PHP array_diff 计算数组的差集
array_diff (PHP 4 >= 4.0.1, PHP 5) array_diff — 计算数组的差集说明 array array_diff ( array $array1 , arr ...
转：40个Java集合面试问题和答案
转自牛客网:http://mp.weixin.qq.com/s?__biz=MjM5NDYxMzk1Nw==&mid=215319390&idx=1&sn=1ab621bc40 ...

python开发_html_html处理

python开发_html_html处理的更多相关文章

随机推荐

热门专题