直接复制粘贴笔记发现有问题 文档下载地址//download.csdn.net/download/hide_on_rush/12266493 掌握定向网络数据爬取和网页解析的基本能力常用的 Python IDE 工具 文本工具类 IDE 集成工具类 IDE IDLE PyCharm Notepad++ Wing Sublime Text * …
如果要爬取的内容嵌在网页源代码中的话,直接下载网页源代码再利用正则表达式来寻找就ok了.下面是个简单的例子: import urllib.request html = urllib.request.urlopen('http://www.massey.ac.nz/massey/learning/programme-course/programme.cfm?prog_id=93536') html = html.read().decode('utf-8') 注意,decode方法有时候可能会报错,…