前言 拿来练手的,比较简单(且有bug),欢迎交流~ 功能介绍 抓取当日的知乎日报的内容,并将每篇博文另存为一个txt文件,集中放在一个文件夹下,文件夹名字为当日时间. 使用的库 re,BeautifulSoup,sys,urllib2 注意事项 1.运行环境是Linux,python2.7.x,想在win上使用直接改一下里边的命令就可以了 2.bug是在处理 “如何正确吐槽”的时候只能获取第一个(懒癌发作了) 3.直接获取(如下)内容是不可以的,知乎做了反抓取的处理 urllib2.urlop