python信用评分卡建模(附代码,博主录制)

原文链接 https://blog.csdn.net/LuYi_WeiLin/article/details/87907948

(八)行为评分卡模型(B卡)的介绍

在信贷业务中,评分卡分为三种:

申请评分卡(A卡)
    行为评分卡(B卡)
    催收评分卡(C卡)

本篇我们来学习一下行为评分卡(B卡),首先什么是行为评分卡呢,行为评分卡的使用场景以及目的,适用的信贷产品?

其中特别注意一下,不适合先息后本的信贷产品,因为每个月的违约概率不一样,不好预测

观察期和表现期

学习行为评分卡之前,要了解一些概念,什么是观察期和表现期,什么是观察点

观察期观察的是行为,表现期预测表现好坏

P(表现期好坏/观察期行为)

这里要注意一下,假如我们定义表现坏客户为M3+,观察期时间窗口为12个月,则起码要收集12+3个月的数据

当然观察点也不宜太长,因为不到MOB的客户,不能进入行为评分卡中,会丢失大量重要数据

当此刻的时间满足了MOB但是不满足观察期,也可以构建B卡,但是有一些变量表现效果不怎么好(因为和每个变量的收集间隔有关,间隔长的变量收集得太少,表现自然不佳)

讲完了观察期和表现期,我们就来讲一下信用评分卡常用的特征构造,特征构造之前我们来学习一个定义:时间切片

特征构造

一般有以下几类特征

还款率类型的特征

额度使用率类型的特征

逾期类型的特征

这里注意一下,不能用轻度逾期去预测轻度逾期,不能用重度逾期去预测重度逾期,这里的目标变量是DPD(day past due)90,变量可以是DPD60、DPD30等

消费类型的特征(每一笔消费有具体详细可以做)

三方机构(社交数据、出行数据)

下面就来讲解一下行为评分卡建立模型的步骤(和申请评分卡差不多)

数据预处理
    特征衍生

特征处理与筛选

特征挑选

变量分箱
    模型的参数估计(逻辑回归模型)

添加完所有变量后,逻辑回归结果如下图所示,还是存在P值不显著情况,单独拿去这些变量一个一个与目标变量进行逻辑回归检验其显著性

也就是挑选4个GBDT模型最重要的变量进行逻辑回归后,发现其逻辑回归系数为负,之后我们按照GBDT模型变量重要性降序顺序一个一个往里面加,每加一个,进行一次逻辑回归,发现存在逻辑回归系数为正的,就可以把该变量剔除

逻辑回归要求系数为负而且P值要显著,我们使用外生模型GBDT估计模型重要性

所以,我们使用LASSO再次进行变量挑选

模型的性能测试

概率转换为分数

https://study.163.com/course/courseMain.htm?courseId=1005988013&share=2&shareId=400000000398149(博主录制,2K超清分辨率)

(信贷风控八)行为评分卡模型(B卡)的介绍的更多相关文章

  1. (信贷风控九)行为评分卡模型python实现

    python信用评分卡建模(附代码,博主录制) https://study.163.com/course/introduction.htm?courseId=1005214003&utm_ca ...

  2. 基于Python的信用评分卡模型分析(二)

    上一篇文章基于Python的信用评分卡模型分析(一)已经介绍了信用评分卡模型的数据预处理.探索性数据分析.变量分箱和变量选择等.接下来我们将继续讨论信用评分卡的模型实现和分析,信用评分的方法和自动评分 ...

  3. 基于Python的信用评分卡模型分析(一)

    信用风险计量体系包括主体评级模型和债项评级两部分.主体评级和债项评级均有一系列评级模型组成,其中主体评级模型可用“四张卡”来表示,分别是A卡.B卡.C卡和F卡:债项评级模型通常按照主体的融资用途,分为 ...

  4. (十三)GBDT模型用于评分卡模型python实现

    python信用评分卡建模(附代码,博主录制) https://study.163.com/course/introduction.htm?courseId=1005214003&utm_ca ...

  5. 信贷风控模型开发----模型流程&好坏样本定义

    第二章 模型开发流程&好坏样本定义 2.1模型开发流程 2.1.1 评分模型流程图 2.1.2流程图阐述 该小结提出了一些数据指标,如果不明白没有关系,往后的文章笔者会一个个地解释这些指标的含 ...

  6. 3分钟搞明白信用评分卡模型&模型验证

    信用评分卡模型在国外是一种成熟的预测方法,尤其在信用风险评估以及金融风险控制领域更是得到了比较广泛的使用,其原理是将模型变量WOE编码方式离散化之后运用logistic回归模型进行的一种二分类变量的广 ...

  7. 评分卡模型剖析之一(woe、IV、ROC、信息熵)

    信用评分卡模型在国外是一种成熟的预测方法,尤其在信用风险评估以及金融风险控制领域更是得到了比较广泛的使用,其原理是将模型变量WOE编码方式离散化之后运用logistic回归模型进行的一种二分类变量的广 ...

  8. WOE:信用评分卡模型中的变量离散化方法(生存分析)

    WOE:信用评分卡模型中的变量离散化方法 2016-03-21 生存分析 在做回归模型时,因临床需要常常需要对连续性的变量离散化,诸如年龄,分为老.中.青三组,一般的做法是ROC或者X-tile等等. ...

  9. 信用评分及模型原理解析(以P2P网贷为例)

    本博文将针对消费贷款领域的信用评分及其模型进行相关研究探讨.虽然人人都可以通过对借款方在Lending Club(国外最大的P2P网站)和Prosper上的历史借贷数据进行分析,但我相信,了解消费信贷 ...

随机推荐

  1. 加密类型、数据加密解密过程以及CA创建

    对称加密算法 对称加密:加密和解密使用同一个密钥 DES:Data Encryption Standard,56bits 3DES: AES:Advanced (, , 256bits) Blowfi ...

  2. java基础(13)---集合框架

    一.集合框架 Java的集合类是一些非常实用的工具类,主要用于存储和装载数据 (包括对象),因此,Java的集合类也被成为容器.在Java中,所有的集合类都位于java.util包下,这些集合类主要是 ...

  3. 最小生成树:Tree

    参考资料:https://blog.csdn.net/sunshinezff/article/details/48749453 Description 给你一个无向带权连通图,每条边是黑色或白色.让你 ...

  4. P2577 [ZJOI2005]午餐[DP]

    题目描述 上午的训练结束了,THU ACM小组集体去吃午餐,他们一行N人来到了著名的十食堂.这里有两个打饭的窗口,每个窗口同一时刻只能给一个人打饭.由于每个人的口味(以及胃口)不同,所以他们要吃的菜各 ...

  5. arcgis api for js 出现跨域问题

    最近几天在开始入手 arcgis api for js .那就先写些Demo练练手. 选择百度地图.这里用的是拼地图 url 的方式来加载百度地图. 加载百度地图参考的是:ArcGIS API for ...

  6. LG2662 牛场围栏 和 test20181107 数学题

    P2662 牛场围栏 题目背景 小L通过泥萌的帮助,成功解决了二叉树的修改问题,并因此写了一篇论文, 成功报送了叉院(羡慕不?).勤奋又勤思的他在研究生时期成功转系,考入了北京大学光华管理学院!毕业后 ...

  7. python - django (ORM常用字段)

    # """ python manage.py makemigrations # 更新操作 python manage.py migrate # 转换sql语句到数据库 1 ...

  8. export的几种用法

    记录一下export的几种写法. 0.入口文件为index.js,引用add-content.js的内容 1.  export default 方式,直接导出变量 add-content.js的内容如 ...

  9. Codeforces Round #609 (Div. 2) 【A,B,C】

    题意:给一个n<=1e7,找两个合数a和b使得a-b的差为n. 构造a=3n,b=2n,必含有公因子n,只有当n是1的时候是特例. #include<bits/stdc++.h> u ...

  10. django 第三天 视图

    今日内容 一.url路由分发之include 项目文件夹下的urls.py文件中的url写法: from django.conf.urls import url,include from django ...