【笔记】ROC曲线

ROC曲线

前文讲了PR曲线

这里说ROC曲线，其描述的是TPR和FPR之间的关系

TPR是什么呢，TPR就是召回率

FPR是什么呢，FPR就是和TPR对应的，即真实值为0的一行中的预测为1的部分比例

和精准率和召回率一样，TPR和FPR之间也有着内在的联系，TPR越高，FPR越高，反之一样，ROC曲线就是刻画这样的关系的曲线

快速的实现一下TPR和FPR的函数，在python chame中的metrics中写入下列代码，依次是实现TN，FP，FN，TP，混淆矩阵，精准率，召回率，F1 score，TPR，FPR，前面部分都在前面博客有相应的原理的代码，关于TPR和FPR的，也只是将公示带入使用

代码如下

def TN(y_true, y_predict):

    assert len(y_true) == len(y_predict)

    return np.sum((y_true == 0) & (y_predict == 0))

def FP(y_true, y_predict):

    assert len(y_true) == len(y_predict)

    return np.sum((y_true == 0) & (y_predict == 1))

def FN(y_true, y_predict):

    assert len(y_true) == len(y_predict)

    return np.sum((y_true == 1) & (y_predict == 0))

def TP(y_true, y_predict):

    assert len(y_true) == len(y_predict)

    return np.sum((y_true == 1) & (y_predict == 1))

def confusion_matrix(y_true, y_predict):

    return np.array([

        [TN(y_true, y_predict), FP(y_true, y_predict)],

        [FN(y_true, y_predict), TP(y_true, y_predict)]

    ])

def precision_score(y_true, y_predict):

    assert len(y_true) == len(y_predict)

    tp = TP(y_true, y_predict)

    fp = FP(y_true, y_predict)

    try:

        return tp / (tp + fp)

    except:

        return 0.0

def recall_score(y_true, y_predict):

    assert len(y_true) == len(y_predict)

    tp = TP(y_true, y_predict)

    fn = FN(y_true, y_predict)

    try:

        return tp / (tp + fn)

    except:

        return 0.0

def f1_score(y_true, y_predict):

    precision = precision_score(y_true, y_predict)

    recall = recall_score(y_true, y_predict)

    try:

        return 2 * precision * recall / (precision + recall)

    except:

        return 0.0

def TPR(y_true, y_predict):

    tp = TP(y_true, y_predict)

    fn = FN(y_true, y_predict)

    try:

        return tp / (tp + fn)

    except:

        return 0.

def FPR(y_true, y_predict):

    fp = FP(y_true, y_predict)

    tn = TN(y_true, y_predict)

    try:

        return fp / (fp + tn)

    except:

        return 0.

具体使用

（在notebook中）

使用手写数据集，进行先前的操作布置好需要的变量以及数据分割，不再赘述

使用封装好的FPR和TPR，和前面绘制PR曲线的思想一致，然后绘制图像

  from metrics import FPR,TPR

  fprs = []

  tprs = []

  thresholds = np.arange(np.min(decision_scores),np.max(decision_scores),0.1)

  for threshold in thresholds:

      y_predict = np.array(decision_scores >= threshold,dtype='int')

      fprs.append(FPR(y_test,y_predict))

      tprs.append(TPR(y_test,y_predict))

  plt.plot(fprs,tprs)

图像如下

使用sklearn中的ROC曲线，调用方式和先前PR曲线的使用很像，绘制图像

  from sklearn.metrics import roc_curve

  fprs, tprs, thresholds = roc_curve(y_test,decision_scores)

  plt.plot(fprs,tprs)

图像如下（ROC曲线下的面积可以作为一个指标）

求解的话一样可以使用sklearn中的roc_auc_score，即可求出面积值的作为的指标

  from sklearn.metrics import roc_auc_score

  roc_auc_score(y_test,decision_scores)

结果如下

可以看出来，ROC的指标对偏斜的数据不算敏感，不想精准率和召回率那样敏感，所以针对极度偏斜的数据使用精准率和召回率是不错的，ROC曲线的应用场景是可以确定更好的模型，即面积更大模型

【笔记】ROC曲线的更多相关文章

PR曲线，ROC曲线，AUC指标等，Accuracy vs Precision
作为机器学习重要的评价指标,标题中的三个内容,在下面读书笔记里面都有讲: http://www.cnblogs.com/charlesblc/p/6188562.html 但是讲的不细,不太懂.今天又 ...
R语言︱ROC曲线——分类器的性能表现评价
笔者寄语:分类器算法最后都会有一个预测精度,而预测精度都会写一个混淆矩阵,所有的训练数据都会落入这个矩阵中,而对角线上的数字代表了预测正确的数目,即True Positive+True Nagetiv ...
分类器评估方法：ROC曲线
注:本文是人工智能研究网的学习笔记 ROC是什么二元分类器(binary classifier)的分类结果 ROC空间最好的预测模型在左上角,代表100%的灵敏度和0%的虚警率,被称为完美分类器. ...
Mean Average Precision（mAP）,Precision，Recall，Accuracy，F1_score，PR曲线、ROC曲线，AUC值，决定系数R^2 的含义与计算
背景之前在研究Object Detection的时候,只是知道Precision这个指标,但是mAP(mean Average Precision)具体是如何计算的,暂时还不知道.最近做OD的任 ...
ROC曲线、PR曲线
在论文的结果分析中,ROC和PR曲线是经常用到的两个有力的展示图. 1.ROC曲线 ROC曲线(receiver operating characteristic)是一种对于灵敏度进行描述的功能图像. ...
精确率与召回率，RoC曲线与PR曲线
在机器学习的算法评估中,尤其是分类算法评估中,我们经常听到精确率(precision)与召回率(recall),RoC曲线与PR曲线这些概念,那这些概念到底有什么用处呢? 首先,我们需要搞清楚几个拗口 ...
【数据挖掘】朴素贝叶斯算法计算ROC曲线的面积
题记: 近来关于数据挖掘学习过程中,学习到朴素贝叶斯运算ROC曲线.也是本节实验课题,roc曲线的计算原理以及如果统计TP.FP.TN.FN.TPR.FPR.ROC面积等等.往往运用 ...
机器学习之分类器性能指标之ROC曲线、AUC值
分类器性能指标之ROC曲线.AUC值一 roc曲线 1.roc曲线:接收者操作特征(receiveroperating characteristic),roc曲线上每个点反映着对同一信号刺激的感受性 ...
[zz] ROC曲线
wiki https://zh.wikipedia.org/wiki/ROC%E6%9B%B2%E7%BA%BF 在信号检测理论中,接收者操作特征曲线(receiver operating chara ...

随机推荐

CentOS-Docker安装phpMyAdmin(MySQL的web客户端)
注:phpMyAdmin是一款MySQL的web客户端,还是很直观且好用的,所以推荐给你~ 下载镜像 $ docker pull phpmyadmin/phpmyadmin 运行镜像 1.无指定固定数 ...
CentOS-自定义SFTP用户及目录
ftp功能说明:通过SSH启动CentOS的sftp功能创建用户组及用户(sftp可变) $ groupadd sftp $ useradd -g sftp -s /sbin/nologin -d ...
Java：Java的重写与重载区分
最明显的区别为:重写只存在于子类与父类中,重载存在于一个类中. 具体区别如下: 一.重写(override) override是重写(覆盖)了一个方法,以实现不同的功能.一般是用于子类在继承父类时,重 ...
MySQL 数据排序 order by
1.单一字段排序 select * from tablename order by field1 desc; 排序采用order by+排序字段升序关键字(asc,desc),排序字段可以放多个,多 ...
windows服务器下MySQL配置字符集
这俩天公司使用.netcore微服务+mysql做项目,mysql在使用的时候总是出现一些字符集的问题,修改utf8或utf8mb4后mysql的服务就启动不了,这里做下记录如果把my.ini中的字符 ...
python使用笔记002
一.字符串常用方法 1 s = ' ha.hahaha.' 2 print(s.count('a'))#找某一个元素在字符串里出现的次数 3 print(s.index('a'))#找某一个元素的下标 ...
python 元组推导式
>>> b=(page for page in range(10))>>> print(b)<generator object <genexpr> ...
__schedule的一些小细节
(代码主要参考5.10) 1. __schedule的参数preempt static void __sched notrace __schedule(bool preempt) preempt是一个 ...
[刘阳Java]_CSS数字分页效果
先给出效果图,见下图.下图主要的完成当鼠标放到分页数字的上会呈现一个变大的效果实现思路: (1). 使用浮动属性,以便让li元素水平排列. (2).将a元素设置为块级元素,然后设置它们的尺寸. (3 ...
vue2.x移动端ui框架选型
前言最近公司准备做移动端spa项目,需要选一个ui框架.优先考虑谷歌Material Design设计风格.针对市面上的框架进行了一次调研,简单总结如下. 选型原则:1. 优先考虑md风格. 2. ...

【笔记】ROC曲线

ROC曲线

【笔记】ROC曲线的更多相关文章

随机推荐

热门专题