利用python监控CNNVD上面的新出漏洞实例，可以配合邮箱推送获取最新的漏洞情报

爬取cnnvd

import requests

from bs4 import BeautifulSoup

import re

import time

import csv

k = int(input("第几页结束"))

for n in range(1, k + 1):

   # n = int(input("第几页"))

   url = f"http://www.cnnvd.org.cn/web/cnnvdpatch/querylist.tag?pageno={n}"  # 访问这个网址拿取源码

   url_1 = "http://www.cnnvd.org.cn/"

   head = {

      "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.5060.53 Safari/537.36 Edg/103.0.1264.37"

   }

   data = requests.get(url, headers=head)

   # print(data.text)

   bs = BeautifulSoup(data.text, "html.parser")

   # print(bs)

   positioning = bs.find("div", class_="list_list").find_all("a")  # 找到特殊位置进行筛选 不能_class 只可以class_

   obj = re.compile(r'meta name="title" content="(?P<name>.*?)"', re.S)  # 使用re.S参数以后，正则表达式会将这个字符串作为一个整体，在整体中进行匹配

   # print(positioning)

   obj_2 = re.compile(r'</a><p><span>(?P<time>.*?).*?</span>(?P<time_1>.*?)</p>', re.S)  # 匹配时间的正则

   f = open("bugku.csv", "a+", encoding="utf-8")

   csv_writer = csv.writer(f)

   if n == 1:

      csv_writer.writerow(["漏洞名字", "修复措施", "发布时间"])

   else:

      pass

   for a in positioning:

      # print(a.get("href"))  # BeautifulSoup可以通过get直接拿到href里面的链接

      wangye = url_1 + a.get("href").strip("/")  # 拼接新链接

      req = requests.get(wangye)  # 通过get访问新链接

      # print(req.text)

      names = obj.findall(req.text)

      times = obj_2.finditer(req.text)  # 在req里面匹配时间整成元组

      for b in times:

         nams = names[-1]  # 漏洞名字

         uul = wangye  # 修复网页

         timetime = b.group("time") + b.group("time_1")  # 时间

         print(nams, uul, timetime)

         csv_writer.writerow([nams, uul, timetime])

   time.sleep(2)

   f.close()

   print("休息15秒")

   time.sleep(15)

Python爬取cnnvd的更多相关文章

Python 爬取所有51VOA网站的Learn a words文本及mp3音频
Python 爬取所有51VOA网站的Learn a words文本及mp3音频 #!/usr/bin/env python # -*- coding: utf-8 -*- #Python 爬取所有5 ...
python爬取网站数据
开学前接了一个任务,内容是从网上爬取特定属性的数据.正好之前学了python,练练手. 编码问题因为涉及到中文,所以必然地涉及到了编码的问题,这一次借这个机会算是彻底搞清楚了. 问题要从文字的编码讲 ...
python爬取某个网页的图片-如百度贴吧
python爬取某个网页的图片-如百度贴吧作者:vpoet mail:vpoet_sir@163.com 注:随意copy,不用告诉我 #coding:utf-8 import urllib imp ...
Python:爬取乌云厂商列表，使用BeautifulSoup解析
在SSS论坛看到有人写的Python爬取乌云厂商,想练一下手,就照着重新写了一遍原帖:http://bbs.sssie.com/thread-965-1-1.html #coding:utf- im ...
使用python爬取MedSci上的期刊信息
使用python爬取medsci上的期刊信息,通过设定条件,然后获取相应的期刊的的影响因子排名,期刊名称,英文全称和影响因子.主要过程如下: 首先,通过分析网站http://www.medsci.cn ...
python爬取免费优质IP归属地查询接口
python爬取免费优质IP归属地查询接口具体不表,我今天要做的工作就是: 需要将数据库中大量ip查询出起归属地刚开始感觉好简单啊,毕竟只需要从百度找个免费接口然后来个python脚本跑一晚上就o ...
Python爬取豆瓣指定书籍的短评
Python爬取豆瓣指定书籍的短评 #!/usr/bin/python # coding=utf-8 import re import sys import time import random im ...
python爬取网页的通用代码框架
python爬取网页的通用代码框架: def getHTMLText(url):#参数code缺省值为‘utf-8’(编码方式) try: r=requests.get(url,timeout=30) ...
没有内涵段子可以刷了，利用Python爬取段友之家贴吧图片和小视频(含源码)
由于最新的视频整顿风波,内涵段子APP被迫关闭,广大段友无家可归,但是最近发现了一个"段友"的app,版本更新也挺快,正在号召广大段友回家,如下图,有兴趣的可以下载看看(ps:我不 ...
python 爬取历史天气
python 爬取历史天气官网:http://lishi.tianqi.com/luozhuangqu/201802.html # encoding:utf-8 import requests fr ...

随机推荐

关于图计算&图学习的基础知识概览：前置知识点学习（Paddle Graph Learning (PGL)）
关于图计算&图学习的基础知识概览:前置知识点学习(Paddle Graph Learning (PGL)) 欢迎fork本项目原始链接:关于图计算&图学习的基础知识概览:前置知识点学习 ...
java学习之spring基础
0x00前言 spring框架应用的是ioc模式,ioc模式是指控制反转模式,本质是你不去创建对象让spring框架给你创建对象你去使用对象.多种开发模式通过配置文件和注解的方式去开发的都很值得去学习 ...
ValidList
package com.dlzb.enterprising.config; import javax.validation.Valid; import java.util.*; public clas ...
基于python的数学建模---时间序列
JetRail高铁乘客量预测--7种时间序列方法数据获取:获得2012-2014两年每小时乘客数量 import pandas as pd import numpy as np import mat ...
Gorm源码学习-数据库连接
1 前言 gorm源码地址: Gorm , 本文基于commit:cef3de694d9615c574e82dfa0b50fc7ea2816f3e 官方入门指南: Dosc 2 连接数据库代码示例目 ...
关于python实现与体重秤蓝牙ble通信研究(Linux)
前言前几天买一个带蓝牙的体重秤,功能就是可以通过手机app连接,然后每一次称重都会记录下来,然后进行一些计算(体脂等),但是我不想用手机来操作,我习惯用电脑,就想写一个软件来与体重秤通信,记录我的每 ...
关于vlc"编解码器暂不支持: VLC 无法解码格式“MIDI” (MIDI Audio)"解决
解决办法 sudo apt install vlc-plugin-fluidsynth
windows 使用ACR122U-A9设备读写M1卡
软件地址 M1卡服务程序安装好驱动后就可以破解,破解成功后的秘钥会显示出来(记录下来),同级目录会生成一个dump文件,这个文件包含此M1卡的全部数据,可以使用hexedit打开,编辑或修改 Mif ...
【每日一题】【DFS和回溯的区别】【BFS】104. 二叉树的最大深度-211227/220218
给定一个二叉树,找出其最大深度. 二叉树的深度为根节点到最远叶子节点的最长路径上的节点数. 说明: 叶子节点是指没有子节点的节点. 示例:给定二叉树 [3,9,20,null,null,15,7], ...
浏览器内存漫游解决方案(js逆向)
//浏览器内存漫游解决方案(js逆向) //原理通过ast把所有的变量,参数中间值进行内存的存储 //搜索AST-hook,进入github //现在github的库下载下来 //anyproxy n ...

Python爬取cnnvd

爬取cnnvd

Python爬取cnnvd的更多相关文章

随机推荐

热门专题