最近玩爬虫,先把python解析器 beautifulsoup 练练
这个 tainiu.html 是从百度网盘里拷贝一段html
  1. from bs4 importBeautifulSoup
  2. with open('tainiu.html','r',encoding ='UTF-8')as f:
  3. html = f.read()
  4. # 这里的编码默认不行 一定要写上 否则报错 
  5. # 应该跟具体情况有关, python 教学视频里 就不写encoding 没错误 实际用 就出问题
  6. soup =BeautifulSoup(html,'html.parser')
  7. alist = soup.find_all(class_='filename')
  8. for a in alist:
  9. print(a.string)
结果:
 
每学网PHP JAVA珍贵学习资源.zip
泰牛程序员 韩顺平 PHP微信开发公开课 01讲 注册属于自己的微信公众平台.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 02讲 打造自己的微信平台.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 03讲 PHP大牛班 .wmv
泰牛程序员 韩顺平 PHP微信开发公开课 04讲 微信开发模式 .wmv
泰牛程序员 韩顺平 PHP微信开发公开课 05讲 接入自己的微信服务器.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 06讲 开发简单的微信计算器.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 07讲 上节课回顾.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 08讲 SAE使用(上).wmv
泰牛程序员 韩顺平 PHP微信开发公开课 09讲 SAE使用(下).wmv
泰牛程序员 韩顺平 PHP微信开发公开课 10讲 SAE与SVN整合(上).wmv
泰牛程序员 韩顺平 PHP微信开发公开课 11讲 SAE与SVN整合(下).wmv
泰牛程序员 韩顺平 PHP微信开发公开课 12讲 仿腾讯事实派(上).wmv
泰牛程序员 韩顺平 PHP微信开发公开课 13讲 仿腾讯事实派(中).wmv
泰牛程序员 韩顺平 PHP微信开发公开课 14讲 仿腾讯事实派(下).wmv
泰牛程序员 韩顺平 PHP微信开发公开课 15讲 仿腾讯事实派动态调用数据.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 16讲 微信在线音乐点播(上).wmv
泰牛程序员 韩顺平 PHP微信开发公开课 17讲 微信在线音乐点播(下).wmv
泰牛程序员 韩顺平 PHP微信开发公开课 18讲 定位地理位置.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 19讲 微信地理位置查询并入库.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 20讲 POI显示地点详情.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 21讲 刮刮乐.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 22讲 幸运大转盘.wmv
泰牛程序员韩顺平 PHP微信开发公开课 PPT 源代码 课堂笔记下载说明.zip
 
呵呵 顺便分享一下 我的视频收藏
链接: http://pan.baidu.com/s/1c2eg9FE 密码: bh3r

python页面解析_beautifulsoup试玩的更多相关文章

  1. python爬虫主要就是五个模块:爬虫启动入口模块,URL管理器存放已经爬虫的URL和待爬虫URL列表,html下载器,html解析器,html输出器 同时可以掌握到urllib2的使用、bs4(BeautifulSoup)页面解析器、re正则表达式、urlparse、python基础知识回顾(set集合操作)等相关内容。

    本次python爬虫百步百科,里面详细分析了爬虫的步骤,对每一步代码都有详细的注释说明,可通过本案例掌握python爬虫的特点: 1.爬虫调度入口(crawler_main.py) # coding: ...

  2. Python的Web编程[0] -> Web客户端[1] -> Web 页面解析

     Web页面解析 / Web page parsing 1 HTMLParser解析 下面介绍一种基本的Web页面HTML解析的方式,主要是利用Python自带的html.parser模块进行解析.其 ...

  3. 试玩 GOWOG ,初探 OpenAI(使用 NeuroEvolution 神经进化)与 Golang 多人在线游戏开发

    GOWOG: 原项目:https://github.com/giongto35/gowog 我调整过的:https://github.com/Kirk-Wang/gowog GOWOG 是一款迷你的, ...

  4. Python网页解析库:用requests-html爬取网页

    Python网页解析库:用requests-html爬取网页 1. 开始 Python 中可以进行网页解析的库有很多,常见的有 BeautifulSoup 和 lxml 等.在网上玩爬虫的文章通常都是 ...

  5. HTML5+JS 《五子飞》游戏实现(七)游戏试玩

    前面第一至第六章我们已经把<五子飞>游戏的基本工作都已经讲得差不多了,这一章主要是把所有的代码分享给大家,然后小伙伴们也可以玩一玩. 至于人机对战的我们放到后面讲进行分析. 试玩地址:ht ...

  6. Python 文本解析器

    Python 文本解析器 一.课程介绍 本课程讲解一个使用 Python 来解析纯文本生成一个 HTML 页面的小程序. 二.相关技术 Python:一种面向对象.解释型计算机程序设计语言,用它可以做 ...

  7. ESP32 LyraT音频开发板试玩(一):搭建开发环境

    我是卓波,很高兴你来看我的博客. 系列文章: ESP32 LyraT音频开发板试玩(一):搭建开发环境 ESP32 LyraT音频开发板试玩(二):播放音乐 关于ESP32的开发环境搭建,官方有教程, ...

  8. Python爬虫解析网页的4种方式 值得收藏

    用Python写爬虫工具在现在是一种司空见惯的事情,每个人都希望能够写一段程序去互联网上扒一点资料下来,用于数据分析或者干点别的事情. ​ 我们知道,爬虫的原理无非是把目标网址的内容下载下来存储到内存 ...

  9. 用 ElementTree 在 Python 中解析 XML

    用 ElementTree 在 Python 中解析 XML 原文: http://eli.thegreenplace.net/2012/03/15/processing-xml-in-python- ...

随机推荐

  1. verilog 代码分析与仿真

    verilog 代码分析与仿真 注意:使用vivado 自带的仿真工具, reg和wire等信号需要赋予初始值 边沿检测 module signal_test( input wire cmos_pcl ...

  2. ftp 和vsftp

    内置sftp:https://blog.csdn.net/xinxin19881112/article/details/46831311 vsftp:http://blog.51cto.com/cui ...

  3. Spring Boot使用单元测试

    一.Service层单元测试: 代码如下: package com.dudu.service;import com.dudu.domain.LearnResource;import org.junit ...

  4. word文档内容如何防止被复制

    word2016 审阅->限制编辑->1格式设置编辑 and 2编辑限制->3是,启动强制保护->输入秘密

  5. WPF Binding Mode,UpdateSourceTrigger

    WPF 绑定模式(mode) 枚举值有5个1:OneWay(源变就更新目标属性)2:TwoWay(源变就更新目标并且目标变就更新源)3:OneTime(只根据源来设置目标,以后都不会变)4:OneWa ...

  6. vue源码核心部分

    1.模板编译   初始化时做的:template ==parse()==>ASTtree ==generate()==>render函数  ==> mount(调用dom方法) 每次 ...

  7. MySQL修改数据库、表、列、外键字符编码和排序编码

    在重启Confluence应用时,突然遇见这个检查错误,查询总结需要修改Mysql数据库的所有字符编码和排序编码,报错如下: Confluence Help – This installation o ...

  8. 01-简单编写http服务器

    package com.day3; import java.io.IOException; import java.io.InputStream; import java.net.ServerSock ...

  9. wps表格开发C#

    1.需要添加引用etapi.dll,这个dll在你的wps的安装目录下面可以找到. 2.主要的类: Excel.Application:顶层对象 WorkBook:工作簿 WorkSheet:表 Ra ...

  10. 电商中的库存管理实现-mysql与redis

        库存是电商系统的核心环节,如何做到不少卖,不超卖是库存关心的核心业务问题.业务量大时带来的问题是如何更快速的处理库存计算. 此处以最简模式来讨论库存设计. 以下内容只做分析,不能直接套用,欢迎 ...