网络安全公开数据集Maple-IDS,恶意流量检测数据集开放使用!
Maple Dataset 枫叶数据集
Maple Dataset枫叶数据集由东北林业大学网络安全实验室(https://maple.nefu.edu.cn/lab/)公开发布,是用于入侵检测评估的数据集,其目的在于提升异常基础入侵检测系统(IDS)以及入侵预防系统(IPS)的性能与可靠性。在网络攻击愈发复杂的当下,拥有一个可靠且紧跟时代的数据集,对于测试和验证 IDS 及 IPS 解决方案是极其重要的。
且如今的网络攻击手段多样,攻击者常常采用混合式攻击,如同时结合病毒、木马和网络钓鱼等方式。在这种情况下,如果没有高质量的数据集来对 IDS 和 IPS 进行测试,就难以确保其能有效地抵御这些复杂攻击。又如,新出现的零日攻击等未知威胁,更需要借助最新的数据集来训练和验证防护系统,以便及时发现和防范。
枫叶数据集旨在提供最新的、多样化的攻击数据,以帮助研究人员和开发者更好地评估和改进他们的入侵检测和预防系统。我们在大量的服务上生成并采集了恶意流量,包含了最新的 CVE,以及真实世界中存在着的恶意攻击类型。
数据集官网:https://maple.nefu.edu.cn/
数据集性质:供科研学术可免费公开使用,但请引用我们的官网或论文。
数据集列表:
DDoS: HTTP (Plain/gzip/random), TCP, UDP, ReCOIL, LOIC
DNS: DoH, DoQ, DoT (coming soon)
ICMP: Normal ICMP, Smuggled ICMP
MySQL: CVE-2012-2122
Nginx: CVE-2017-7529
OpenSSL: CVE-2022-0778, HeartBleed, Normal traffic
Windows OS: Windows 10 provision, Windows Update
VPN: Cisco AnyConnect, DNS Leak, Trojan traffic (coming soon)
如何使用
直接使用 CSV 文件
数据集中提供的 CSV 已经符合了 CIC-IDS 中的列与元信息。
改动 Python 中加载 *.csv 的名称即可。
从流量文件手动生成 CSV
准备好上方下载完的数据集流量文件(*.pcap)。
使用 CICFlowMeter (https://github.com/ahlashkari/CICFlowMeter) 打开。
选取离线模式,导出为 CSV 文件。
研究背景
传统的评估数据集的攻击流量和利用方式,往往内容过时、流量多样性不足、攻击种类不足、特征不足。重要的是,随着 HTTPS/TLS 加密的普及了,恶意流量被层层加密,无法被安全设备解析。
因此,枫叶数据集提供了一个全面、现代的数据集来供机器学习人员学习恶意流量特征,用于入侵检测研究。
兼容使用CIC-IDS数据集的代码
如果你的代码或模型是用 CIC-IDS 数据集训练或者编写的,那么可以直接更换到枫叶数据集上,我们的格式兼容了 CIC-IDS。
您可以直接使用 CICFlowMeter 这个工具来生成 CSV 文件,输入到机器学习模型中。
无需重写代码或进行其他改动。
数据集类别概览(包含内容)
内容:数据集包含最新的常见攻击,类似于真实世界的网络流量(PCAP/PCAPNG 格式)。
流量分析:使用 CICFlowMeter 进行的网络流量分析结果,标记基于时间戳、源和目标IP地址、端口、协议和攻击类型的流,存储在CSV文件中。
DDoS 攻击:数据集包括 DDoS 攻击,这些在真实世界的网络流量中很常见。并且由于随机内容,数据集更加多样化。GET、POST、HEAD 和 OPTIONS 是最常见的 HTTP 方法。
对每种服务细分的流量包和数据集 :我们对于每种服务(HTTP、HTTPS、SMTP、IMAP、POP3、FTP、SSH、RESTful API、gRPC、WASM)都提供了数据集。
多样的流量 :对于 ping 或者 HTTP,DDoS 的形式就多种多样,TCP,UDP, SYN 攻击,还有 ICMP 走私,我们的数据集都有覆盖到。
N-day 漏洞:数据集包括 n-day 漏洞,如 OpenSSL 中存在的著名漏洞 HeartBleed,日后打算囊括更多的 CVE 漏洞。
更多功能即将推出
DPDK、PF_RING 支持
如果您有任何问题或建议,请给我们反馈。
数据生成
与完全随机的流量不同,我们根据真实世界中用户、端点和流量的行为模式,对流量的结构进行编排配置。在流量加密方法上,基于了 HTTP、HTTPS与SM3/4等进行数据包构造。 模拟了对于 SSH、RESTful API、gRPC、WASM 流量的,这些现代协议及其各种实现等,组成了本数据集的主要部分。
处理工具
在创建数据集的过程中,我们使用了许多自己开发的工具。
它们是开源的,可以从 GitHub 上免费下载。
大部分工具的仓库中都有教程。
联系我们
有任何问题或需要帮助,请随时与我们联系:
电子邮件:maple@nefu.edu.cn
GitHub:github.com/maple-nefu
QQ 群:631300176
东北林业大学实验室官网:https://maple.nefu.edu.cn/lab/
网络安全公开数据集Maple-IDS,恶意流量检测数据集开放使用!的更多相关文章
- 识别TLS加密恶意流量
利用背景流量数据(contexual flow data)识别TLS加密恶意流量 识别出加密流量中潜藏的安全威胁具有很大挑战,现已存在一些检测方法利用数据流的元数据来进行检测,包括包长度和到达间隔时间 ...
- 利用背景流量数据(contexual flow data) 识别TLS加密恶意流量
识别出加密流量中潜藏的安全威胁具有很大挑战,现已存在一些检测方法利用数据流的元数据来进行检测,包括包长度和到达间隔时间等.来自思科的研究人员扩展现有的检测方法提出一种新的思路(称之为“dataomni ...
- 使用机器学习检测TLS 恶意加密流——业界调研***有开源的数据集,包括恶意证书的,以及恶意tls pcap报文***
2018 年的文章, Using deep neural networks to hunt malicious TLS certificates from:https://techxplore.com ...
- 针对于网络安全领域中基于PCAP流量的数据集
网络安全领域中基于PCAP流量的数据集 MAWI Working Group Traffic Archive URL:http://mawi.wide.ad.jp/mawi/ CIC dataset ...
- 基于PU-Learning的恶意URL检测
https://xz.aliyun.com/t/2190 Ya-Lin Zhang, Longfei Li, Jun Zhou, Xiaolong Li, Yujiang Liu, Yuanchao ...
- 基于PU-Learning的恶意URL检测——半监督学习的思路来进行正例和无标记样本学习
PU learning问题描述 给定一个正例文档集合P和一个无标注文档集U(混合文档集),在无标注文档集中同时含有正例文档和反例文档.通过使用P和U建立一个分类器能够辨别U或测试集中的正例文档 [即想 ...
- 机器学习&恶意代码检测简介
Malware detection 目录 可执行文件简介 检测方法概述 资源及参考文献 可执行文件简介 ELF(Executable Linkable Format) linux下的可执行文件格式,按 ...
- DDoS攻击流量检测方法
检测分类 1)误用检测 误用检测主要是根据已知的攻击特征直接检测入侵行为.首先对异常信息源建模分析提取特征向量,根据特征设计针对性的特征检测算法,若新数据样本检测出相应的特征值,则发布预警或进行反应. ...
- 基于深度学习的安卓恶意应用检测----------android manfest.xml + run time opcode, use 深度置信网络(DBN)
基于深度学习的安卓恶意应用检测 from:http://www.xml-data.org/JSJYY/2017-6-1650.htm 苏志达, 祝跃飞, 刘龙 摘要: 针对传统安卓恶意程序检测 ...
- 恶意代码检测工具 -- Mathematics Malware Detected Tools
Mathematics Malware Detected Tools 重要:由于缺少测试数据,部分结论可能不正确.更多更准确的结论,还需要进行大量实验. 概述 mmdt(Mathematics Mal ...
随机推荐
- aach64架构 ubuntu20 桌面版 编译安装ffmpeg难点总结
[编译安装x264] 这一步基本上没有难点 git clone https://gitee.com/mirrors/x264.git ./configure --enable-shared --ena ...
- 移动WEB开发之 -- 流式布局
浏览器现状 视口 视口标签 二倍图 手机端和pc端像素比例不一样 物理像素&物理像素比 背景缩放background-size 背景图片二倍图 移动端开发选择 移动端技术解决方案 特殊样式 常 ...
- 原创软件 | 系统服务工具箱原创软件(587KB)--基于aardio开发的第一个程序
1 系统服务工具箱简介 该软件是我使用aardio开发的第一个程序,它集成了多个系统常用的快捷键,无需记住各种命令就能快捷使用cmd管理员.计算机管理.控制面板.组策略.注册表.服务.任务管理.卸载程 ...
- 拥抱未来:GPT-4将如何改变我们的世界
随着人工智能技术的迅猛发展,我们正迎来一个全新的智能时代.在这个时代的前沿,GPT-4作为开拓者和领航者,正在重新定义人机交互.创意创新和个性化服务的标准.无论是在商业领域.教育场景还是科研领域,GP ...
- CSS:弹性布局(display:flex)
道友请了~ 最近小道在修练主修功法<嘉蛙>之余,偶然从一名散修手中得到了一本<CSS秘籍>,刚好近期有自己做微信小程序的打算,这不是瞌睡了给递枕头么.欣喜若狂,翻开第一章,拜读 ...
- Day 10 - 动态规划与树状数组
动态规划基础 主要介绍动态规划的基本思想,以及动态规划中状态及状态转移方程的设计思路,帮助各位初学者对动态规划有一个初步的了解. 引入 [IOI1994] 数字三角形. 给定一个 \(r\) 行的数字 ...
- Python 按规则解析字符串中的嵌套函数并实现函数调用
按规则解析字符串中的嵌套函数并实现函数调用 需求 1.按照一定规则解析字符串中的函数表达式,并替换这些表达式.这些函数表达式可能包含其它函数表达式,即支持函数嵌套 2.函数表达式格式:${ __函数名 ...
- gist.github.com 无法访问解决办法,亲测永远有效!
1.打开https://www.ipaddress.com/,输入gist.github.com获取IP地址 2.ping 此ip地址,可以访问 3.将IP地址写入Hosts文件,140.82.113 ...
- scratch源码下载 | 几何冲刺
程序说明: <几何冲刺>是一款基于Scratch平台开发的跑酷类游戏程序.在这个游戏中,玩家控制一个黄色的小方块,在快速向前冲刺的过程中躲避各种障碍物.通过按下键盘上的上方向键,玩家可以操 ...
- 如何在Linux云服务器上通过Docker Compose部署安装Halo,搭建个人博客网站?
目录 前置步骤 环境搭建 创建容器组 在系统任意位置创建一个文件夹 创建docker-compose.yaml 启动 Halo 服务 配置反向代理以及域名解析 Halo初始化页面. 更新新版本的hal ...