HTMLParser 笔记

# 关于html.parse.HTMLParser的使用

from html.parser import HTMLParser

class MyHtmlParser(HTMLParser):

    # 使用“<!DOCTYPE html>”将会被调出来

    def handle_decl(self, decl):

        # 实现基类的方法

        HTMLParser.handle_decl(self, decl)

        # 自定义输出

        print('decl {}'.format(decl))

    # 开始标签

    def handle_starttag(self, tag, attrs):

        HTMLParser.handle_starttag(self, tag, attrs)

        print("start tag is <{}>".format(tag))

    # 结束标签

    def handle_endtag(self, tag):

        HTMLParser.handle_endtag(self, tag)

        print("end tag is </{}>".format(tag))

    # 打印数据

    def handle_data(self, data):

        HTMLParser.handle_data(self, data)

        print('data is {}'.format(data))

    # 打印单标签

    def handle_startendtag(self, tag, attrs):

        HTMLParser.handle_startendtag(self, tag, attrs)

        print('单标签: {}'.format(tag))

    # 打印注释

    def handle_comment(self, data):

        HTMLParser.handle_comment(self, data)

        print("comment is /*{}*/".format(data))

    # 关闭

    def close(self):

        HTMLParser.close(self)

        print('Close...')

my_html_parser = MyHtmlParser()  # 调用解析函数

# HTMLParser.feed()进行解析

my_html_parser.feed("<html><head><title>Test</title></head><body><h1>Parse me!<br /></h1></body></html>")

my_html_parser.close()  # 文件结束的处理方法,貌似可以释放缓冲区

"""

D:\笔记\python电子书\Python3>python index.py

start tag is <html>

start tag is <head>

start tag is <title>

data is Test

end tag is </title>

end tag is </head>

start tag is <body>

start tag is <h1>

data is Parse me!

start tag is <br>

end tag is </br>

单标签: br

end tag is </h1>

end tag is </body>

end tag is </html>

Close...

"""

"""

附加笔记：

HTMLParser.reset():重置实例,丢失所有未处理的数据,这被称为隐式实例化时间

HTMLParser.getpos():返回当前行数和偏移量信息

"""

HTMLParser 笔记的更多相关文章

【搜索引擎Jediael开发笔记3】使用HtmlParser提取网页中的链接
关于HtmpParser的基本内容请见 HtmlParser基础教程本文示例用于提取HTML文件中的链接 package org.ljh.search.html; import java.util. ...
Python学习笔记（四十）— 内置模块（9）HTMLParser
摘抄自:https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000/001432002312 ...
NuGet学习笔记3——搭建属于自己的NuGet服务器
文章导读创建NuGetServer Web站点发布站点到IIS 添加本地站点到包包数据源在上一篇NuGet学习笔记(2) 使用图形化界面打包自己的类库中讲解了如何打包自己的类库,接下来进行最重 ...
NuGet学习笔记(3) 搭建属于自己的NuGet服务器
文章导读创建NuGetServer Web站点发布站点到IIS 添加本地站点到包包数据源在上一篇NuGet学习笔记(2) 使用图形化界面打包自己的类库中讲解了如何打包自己的类库,接下来进行最重 ...
NuGet学习笔记(2) 使用图形化界面打包自己的类库
上文NuGet学习笔记(1) 初识NuGet及快速安装使用说到NuGet相对于我们最重要的功能是能够搭建自己的NuGet服务器,实现公司内部类库的轻松共享更新.在安装好NuGet扩展后,我们已经能够通 ...
IOS学习笔记25—HTTP操作之ASIHTTPRequest
IOS学习笔记25—HTTP操作之ASIHTTPRequest 分类: iOS2012-08-12 10:04 7734人阅读评论(3) 收藏举报 iosios5网络wrapper框架新浪微博 A ...
NuGet学习笔记（转）
NuGet学习笔记(1)——初识NuGet及快速安装使用 http://kb.cnblogs.com/page/143190/ 1. NuGet是什么? NuGet is a Visual Studi ...
NuGet学习笔记(2)——使用图形化界面打包自己的类库
上文NuGet学习笔记(1) 初识NuGet及快速安装使用说到NuGet相对于我们最重要的功能是能够搭建自己的NuGet服务器,实现公司内部类库的轻松共享更新.在安装好NuGet扩展后,我们已经能够通 ...
NuGet学习笔记(3)——搭建属于自己的NuGet服务器(转)
在上一篇NuGet学习笔记(2) 使用图形化界面打包自己的类库中讲解了如何打包自己的类库,接下来进行最重要的一步,从零开始搭建属于自己的NuGet服务器,诚然园子里及其它很多地方已经有完全写好的Nu ...

随机推荐

linux的python版本升级
可利用Linux自带下载工具wget下载,如下所示: # wget http://www.python.org/ftp/python/2.7.3/Python-2.7.13.tgz 下载完成后 ...
mysql主从复制-读写分离
mysql主从复制+读写分离环境:mysql主:193.168.1.1mysql从:193.168.1.2amoeba代理:193.168.1.3########################## ...
idea创建maven spring项目，出现的问题
1.jetty启动后,明明配置文件配置的是 <plugin> <groupId>org.eclipse.jetty</groupId> <artifactId ...
JSON的学习，希望可以指导
1.JSON的介绍是一种轻量级的数据交换格式.简洁和清晰的层次结构使得 JSON 成为理想的数据交换语言. 易于人阅读和编写,同时也易于机器解析和生成,并有效地提升网络传输效率. 2.格式 JSON ...
【转】C++类内存分布
C++类内存分布 https://www.cnblogs.com/jerry19880126/p/3616999.html 书上类继承相关章节到这里就结束了,这里不妨说下C++内存分布结构,我们来看 ...
2.26 js解决click失效问题
2.26 js解决click失效问题前言有时候元素明明已经找到了,运行也没报错,点击后页面没任何反应.这种问题遇到了,是比较头疼的,因为没任何报错,只是click事件失效了.本篇用2种方法解决这种诡 ...
20165228 实验一 Java开发环境的熟悉
20165228 实验一 Java开发环境的熟悉一.实验内容及步骤 (一)使用JDK编译.运行简单的Java程序命令行下Java程序开发 1.用VrtualBox打开Linux虚拟机 2.使用Al ...
java 华容道迷弟版（向 xd-女神吴嘉欣致敬）
// Person.java 每个方块人物是一个类 package test; import javax.swing.*; import java.awt.*; import java.awt.eve ...
HDU2036：改革春风吹满地
Problem Description " 改革春风吹满地, 不会AC没关系; 实在不行回老家, 还有一亩三分地. 谢谢!(乐队奏乐)" 话说部分学生心态极好,每天就知道游戏,这次 ...
四则运算可能需要注意的地方V1.1
作业:https://edu.cnblogs.com/campus/nenu/SWE2017FALL/homework/997 文档下载:https://coding.net/u/Dawnfox/p/ ...

HTMLParser 笔记

HTMLParser 笔记的更多相关文章

随机推荐

热门专题