1. 异常检测简介 异常检测,它的任务是发现与大部分其他对象不同的对象,我们称为异常对象.异常检测算法已经广泛应用于电信.互联网和信用卡的诈骗检测.贷款审批.电子商务.网络入侵和天气预报等领域.这些异常对象的主要成因有:来源于不同的模式.自然变异.数据测量以及随机误差等.而常见的异常检测算法都是针对独立的数据点进行异常检测,此时异常检测又称为离群点检测.而在序列数据的异常检测过程中,我们既可以直接使用对序列进行异常检测的算法,也可以先对序列数据进行特征提取然后转化为传统的离群点检测. 2. 基本…
基于Django Restframework和Spark的异常检测系统,数据库为MySQL.Redis, 消息队列为Celery,分析服务为Spark SQL和Spark Mllib,使用kmeans和随机森林算法对网络服务数据进行分析:数据分为全量数据和正常数据,每天通过自动跑定时job从全量数据中导入正常数据供算法做模型训练. 使用celery批量导入(指定时间段)正常样本到数据库 def add_normal_cat_data(data): """ 构建数据model…
在上篇博文中介绍了网络服务异常检测的大概,本篇将详细介绍SVDD和Isolation Forest这两种算法 1. SVDD算法 SVDD的英文全称是Support Vector Data Description,又称为支持向量数据描述,它是由Tax和Duin提出的一种单分类算法,它起源于V.VapniH的支持向量机.它计算围绕具有一组最小体积的球形决策边界对象,可以用于新奇检测或异常检测,检测从给定数据集中偏离的对象.通过使用不同的内核,SVDD可以获得更灵活和更准确的数据描述,通过区分由训练…
Python的Diagrams库允许通过简单的Python代码绘制云系统架构,实现对新的系统架构进行原型设计.Diagrams的官方仓库地址见:diagrams.Diagrams的官方文档和使用示例见:diagrams-doc. 0 安装 Diagrams库依赖于开源的图可视化工具Graphviz.Python下的Graphviz使用见python模块graphviz使用入门.Graphviz在windows下的安装见Graphviz安装配置教程.在linux下的安装,命令行输入以下指令即可:…
词云Wordcloud是文本数据的一种可视化表示方式.它通过设置不同的字体大小或颜色来表现每个术语的重要性.词云在社交媒体中被广泛使用,因为它能够让读者快速感知最突出的术语.然而,词云的输出结果没有统一的标准,也缺乏逻辑性.对于词频相差较大的词汇有较好的区分度,但对于颜色相近.频次相近的词汇来说效果并不好.因此词云不适合应用于科学绘图.本文基于python库wordcloud来绘制词云.wordcloud安装方式如下: pip install wordcloud 文章目录 0 wordcloud…
blind-watermark是一个能够给图片添加/解析基于频域的数字盲水印的Python库.图像水印image watermark是指在图片里添加文本或图形,以标记图片的来源.但是图像水印会破坏原图.因此另外一种水印形式,即图像盲水印blind image watermark在实践中更多地用于标记图像来源.图像盲水印是一种肉眼不可见的水印,以不可见的形式添加到原始图像中,不会对原始图像的质量产生很大影响.图像盲水印的具体原理见给你的图片加上盲水印. blind-watermark安装命令如下:…
敲<Python机器学习及实践>上的code的时候,对于数据预处理中涉及到的fit_transform()函数和transform()函数之间的区别很模糊,查阅了很多资料,这里整理一下: # 从sklearn.preprocessing导入StandardScaler from sklearn.preprocessing import StandardScaler # 标准化数据,保证每个维度的特征数据方差为1,均值为0,使得预测结果不会被某些维度过大的特征值而主导 ss = Standard…
SSH(Secure Shell)是一种网络安全协议,能够使两台计算机安全地通信和共享数据.目前,SSH协议已在世界各地广泛使用,大多数设备都支持SSH功能.SSH的进一步说明见:深入了解SSH.SSH作为一种协议,存在多种实现,既有商业实现,也有开源实现.OpenSSH是一种流行的SSH协议开源实现,它提供了服务端后台程序和客户端工具,以在远程控制和文件传输期间加密数据.OpenSSH服务端程序一般开发者用不到,OpenSSH提供了以下工具: 通过ssh,scp和sftp完成远程操作 通过ss…
主要有以下四种: 1.Requests抛出一个ConnectionError异常,原因为网络问题(如DNS查询失败.拒接连接等错误) 2.Response.raise_for_status()抛出一个HTTPError异常,原因为HTTP请求返回不成功的状态码(如网页不存在.404错误等) 3.Requests抛出一个Timeout异常,原因为请求超时 4.Requests抛出一个TooManyRedirects异常,原因为请求超过了设定的最大重定向次数…
from PIL import Image from PIL import ImageFilter from PIL import ImageEnhance import matplotlib.pyplot as plt # 将彩色图片转成灰度图片 img = Image.open('pic.jpg') # 读取图片 gray = img.convert('L') # 转成灰度图 plt.figure('将彩色图片转成灰度图片') plt.subplot(1,2,1) plt.title("or…