刚去看了一下,18年2月份写了第一篇关于爬虫的文章(仅仅介绍了使用requests库去获取HTML代码),一年多之后看来很稚嫩也没有多少参考的意义,但没想着要去修改它,留着也是一个回忆吧.至少证明着我是有些许进步的,愿你也是一样! 下面是它的姊妹篇,介绍使用requests和bs4(BeautifulSoup)库来爬取静态网页中的信息. 爬虫从黑盒的角度来看,就是给出网页的链接,输出你想要的信息的一段程序.大概会涉及这几个步骤: 1. 使用requests+re正则 单纯使用requests库来…