最近玩爬虫,先把python解析器 beautifulsoup 练练
这个 tainiu.html 是从百度网盘里拷贝一段html
  1. from bs4 importBeautifulSoup
  2. with open('tainiu.html','r',encoding ='UTF-8')as f:
  3. html = f.read()
  4. # 这里的编码默认不行 一定要写上 否则报错 
  5. # 应该跟具体情况有关, python 教学视频里 就不写encoding 没错误 实际用 就出问题
  6. soup =BeautifulSoup(html,'html.parser')
  7. alist = soup.find_all(class_='filename')
  8. for a in alist:
  9. print(a.string)
结果:
 
每学网PHP JAVA珍贵学习资源.zip
泰牛程序员 韩顺平 PHP微信开发公开课 01讲 注册属于自己的微信公众平台.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 02讲 打造自己的微信平台.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 03讲 PHP大牛班 .wmv
泰牛程序员 韩顺平 PHP微信开发公开课 04讲 微信开发模式 .wmv
泰牛程序员 韩顺平 PHP微信开发公开课 05讲 接入自己的微信服务器.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 06讲 开发简单的微信计算器.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 07讲 上节课回顾.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 08讲 SAE使用(上).wmv
泰牛程序员 韩顺平 PHP微信开发公开课 09讲 SAE使用(下).wmv
泰牛程序员 韩顺平 PHP微信开发公开课 10讲 SAE与SVN整合(上).wmv
泰牛程序员 韩顺平 PHP微信开发公开课 11讲 SAE与SVN整合(下).wmv
泰牛程序员 韩顺平 PHP微信开发公开课 12讲 仿腾讯事实派(上).wmv
泰牛程序员 韩顺平 PHP微信开发公开课 13讲 仿腾讯事实派(中).wmv
泰牛程序员 韩顺平 PHP微信开发公开课 14讲 仿腾讯事实派(下).wmv
泰牛程序员 韩顺平 PHP微信开发公开课 15讲 仿腾讯事实派动态调用数据.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 16讲 微信在线音乐点播(上).wmv
泰牛程序员 韩顺平 PHP微信开发公开课 17讲 微信在线音乐点播(下).wmv
泰牛程序员 韩顺平 PHP微信开发公开课 18讲 定位地理位置.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 19讲 微信地理位置查询并入库.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 20讲 POI显示地点详情.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 21讲 刮刮乐.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 22讲 幸运大转盘.wmv
泰牛程序员韩顺平 PHP微信开发公开课 PPT 源代码 课堂笔记下载说明.zip
 
呵呵 顺便分享一下 我的视频收藏
链接: http://pan.baidu.com/s/1c2eg9FE 密码: bh3r

python页面解析_beautifulsoup试玩的更多相关文章

  1. python爬虫主要就是五个模块:爬虫启动入口模块,URL管理器存放已经爬虫的URL和待爬虫URL列表,html下载器,html解析器,html输出器 同时可以掌握到urllib2的使用、bs4(BeautifulSoup)页面解析器、re正则表达式、urlparse、python基础知识回顾(set集合操作)等相关内容。

    本次python爬虫百步百科,里面详细分析了爬虫的步骤,对每一步代码都有详细的注释说明,可通过本案例掌握python爬虫的特点: 1.爬虫调度入口(crawler_main.py) # coding: ...

  2. Python的Web编程[0] -> Web客户端[1] -> Web 页面解析

     Web页面解析 / Web page parsing 1 HTMLParser解析 下面介绍一种基本的Web页面HTML解析的方式,主要是利用Python自带的html.parser模块进行解析.其 ...

  3. 试玩 GOWOG ,初探 OpenAI(使用 NeuroEvolution 神经进化)与 Golang 多人在线游戏开发

    GOWOG: 原项目:https://github.com/giongto35/gowog 我调整过的:https://github.com/Kirk-Wang/gowog GOWOG 是一款迷你的, ...

  4. Python网页解析库:用requests-html爬取网页

    Python网页解析库:用requests-html爬取网页 1. 开始 Python 中可以进行网页解析的库有很多,常见的有 BeautifulSoup 和 lxml 等.在网上玩爬虫的文章通常都是 ...

  5. HTML5+JS 《五子飞》游戏实现(七)游戏试玩

    前面第一至第六章我们已经把<五子飞>游戏的基本工作都已经讲得差不多了,这一章主要是把所有的代码分享给大家,然后小伙伴们也可以玩一玩. 至于人机对战的我们放到后面讲进行分析. 试玩地址:ht ...

  6. Python 文本解析器

    Python 文本解析器 一.课程介绍 本课程讲解一个使用 Python 来解析纯文本生成一个 HTML 页面的小程序. 二.相关技术 Python:一种面向对象.解释型计算机程序设计语言,用它可以做 ...

  7. ESP32 LyraT音频开发板试玩(一):搭建开发环境

    我是卓波,很高兴你来看我的博客. 系列文章: ESP32 LyraT音频开发板试玩(一):搭建开发环境 ESP32 LyraT音频开发板试玩(二):播放音乐 关于ESP32的开发环境搭建,官方有教程, ...

  8. Python爬虫解析网页的4种方式 值得收藏

    用Python写爬虫工具在现在是一种司空见惯的事情,每个人都希望能够写一段程序去互联网上扒一点资料下来,用于数据分析或者干点别的事情. ​ 我们知道,爬虫的原理无非是把目标网址的内容下载下来存储到内存 ...

  9. 用 ElementTree 在 Python 中解析 XML

    用 ElementTree 在 Python 中解析 XML 原文: http://eli.thegreenplace.net/2012/03/15/processing-xml-in-python- ...

随机推荐

  1. mig_7series_v4_0_data_gen_chk

    mig_7series_v4_0_data_gen_chk `timescale 1ns / 1ps ///////////////////////////////////////////////// ...

  2. [UE4]Background Blur,背景模糊

    一.Blur Strength:模糊强度 二.背景是模糊的,在Background Blur前面的控件二不会模糊. 三.可以调整顺序,让按钮也模糊.然后按钮被模糊了,但是按钮还可以被点击的,Backg ...

  3. 经典笔试题型----IT经理(IT Manager)

    一般企业设置IT部门都是服务性质,虽然谈IT需要成为战略部门许多年,但用脑子想下,这概率有多少?企业存在的第一目标是:赚取利润.贸易型企业最重要的部门为销售部,生产型企业最重要的部门为销售部与生产部, ...

  4. 涂抹mysql笔记-InnoDB/MyISAM及其它各种存储引擎

    存储引擎:一种设计的存取和处理方式.为不同访问特点的表对象指定不同的存储引擎,可以获取更高的性能和处理数据的灵活性.通常是.so文件,可以用mysql命令加载它. 查看当前mysql数据库支持的存储引 ...

  5. wordpress评论回复自动发邮件的功能

    A.插件流,可以说WP强大的插件功能的确能省事不少. 插件的办法一般是两步:第一实现成功发邮件,第二时间评论自动回复,这就需要用到两个插件,一个是Configure SMTP,一个是Mail To C ...

  6. react购物车

    import React, { Component } from 'react';   import {Tabs} from './Tabs'   import 'whatwg-fetch'   im ...

  7. 批量IP自动ping脚本

    批量IP自动ping脚本ping.sh 在同一目录新建一个名为pingip的文件,并以每行一个IP的方式罗列.使用sh命令执行ping.sh #!/bin/bash IP_LIST=`cat ping ...

  8. 序列化与反序列化之Kryo

    序列化:把对象转换为字节序列的过程称为对象的序列化. 反序列化:把字节序列恢复为对象的过程称为对象的反序列化. 需要序列化的情况: 当你想把的内存中的对象状态保存到一个文件中或者数据库中时候: 当你想 ...

  9. 10. 批量插入List<String>

    List<String> iscBusOrgIdList = getIscOrgIdList();List<Map<String, Object>> iscBusO ...

  10. 学习C++,应该循序渐进的看哪些书?

    在某博客上看到的一个C++书籍阅读清单,可以参考下: 阶段 1<Essential C++>这是一本内容不多但很实用的C++入门书籍,强调快速上手与理解C++编程.本书主要围绕一系列逐渐复 ...