要求 [x] Python3+ [x] Chrome驱动并已配置环境变量 [x] Selenium ## 研究页面 发现驾考宝典的科目四页面URL都是以 https://www.jiakaobaodian.com/mnks/exercise/0-car-kemu4-huaibei.html?id=916800,每翻一页最后的id值更新一次 所以,主函数可以写为 python # 1到15题 if __name__ == '__main__': for i in range(0, 15): get
杭电oj并没有反爬 所以直接爬就好了 直接贴源码(参数可改,循环次数可改,存储路径可改) import requests from bs4 import BeautifulSoup import time def write_in_file(number,string):#output function with open ('D:\\python\\python_code\\hdoj\\'+str(number)+".txt","a+",encoding='utf
爬取网页中通知标题的内容展示: this is 1 page!<精算学综合>科目考试参考大纲2016年上半年研究生开题报告评议审核结果公示[答辩]2016下半年研究生论文答辩及学位评定工作安排通知[答辩]2016下半年答辩申请者填报研究生综合管理信息系统的通知[资审]2016年下半年同等学力申请硕士学位资格审查工作办理安排2016上半年同等学力人员师生互选结果公示关于2016年硕博连读研究生选拔结果的公示关于研究生院假期值班安排的通知后八周研究生调停课情况统计2016年度(第一批)研究生学