王青天 孔越编著, 2020年6月第一版

第一章介绍,介绍金融科技fintech是指使用技术提供财务解决方案。人工智能和机器学习技术可以帮助包括欺诈预防、风险管理、客户服务和营销等多个环节的智能化。个人借贷交易的不同阶段涉及线上借贷行业的9种风险:信用检查不足、中介不充分、还款不及时、流动性不足、缺乏透明度、运营和技术失败、法律风险、过度杠杆和道德缺失,其中信用检查不足风险是最需要控制的风险。

个人信贷中信用风险评估的关键是,通过分析借贷人的信用信息,评估借款人的偿还能力和意愿量化违约风险。信用评分卡模型是个人信贷风险管理中的重要手段。评分卡模型过包括申请评分卡、行为评分卡、催收评分卡,除此之外还有反欺诈模型(无征信前、申请数据、第三方数据)、营销评分卡和客户流失卡等。欺诈行为氛围个人欺诈和团伙欺诈,个人欺诈往往形式各异难以形成普适的规则,只能通过不断积累和总结规则库来进行甄别;对于团伙欺诈啊,需要借助知识图谱技术发现欺诈团伙潜在的关系网,找到异常状态进行甄别。因此,反欺诈模型一般采用基于规则与策略的方法。

接下来讲了评分卡模型的开发流程。

第二章,机器学习介绍

机器学习分为有监督学习、无监督学习和强化学习。

有监督学习分为分类问题(离散)和回归(连续)问题。常见算法有线性回归模型、神经网络模型、支持向量机模型、决策树模型、随机森林、Xgboost模型和深度学习模型等。评分卡模型的开发就是有监督学习,而且是分类问题。

无监督学习的任务一般为聚类分析、降维、关联规则分析。常见聚类:Kmeans、混合高斯模型、DBCAN和AP算法等。线性降维方法:PCA,SVD分解;非线性:KPCA。关联规则分析:Apriori和FP-growth,可以通过关联分析挖掘欺诈数据的特征集,形成反欺诈规则。

强化学习又称增强学习(Reinforcement Learning),是一种特定场景下通过不断试错的方式进行自我更新并学习的方法。

python 金融大数据风控建模实战--基于机器学习的更多相关文章

  1. 包银消费CTO汤向军:消费金融大数据风控架构与实践

    1 业务架构 风控平台是相对独立的系统,信审的案件可以从借款端平台推过来,也可以从第三方平台推过来.信审案件到达风控平台后,自动创建工作流,根据风控流程处理各流程环节任务. •自动决策 风控流程自动处 ...

  2. 量化派基于Hadoop、Spark、Storm的大数据风控架构--转

    原文地址:http://www.csdn.net/article/2015-10-06/2825849 量化派是一家金融大数据公司,为金融机构提供数据服务和技术支持,也通过旗下产品“信用钱包”帮助个人 ...

  3. BAT、网易、京东等如何做大数据风控的?

    大数据风控目前应该是前沿技术在金融领域的最成熟应用,相对于智能投顾.区块链等还在初期的金融科技应用,大数据风控目前已经在业界逐步普及,从BATJ这样的大企业,到交易规模比较大的网贷平台,再到做现金贷. ...

  4. 【Todo】【读书笔记】大数据Spark企业级实战版 & Scala学习

    下了这本<大数据Spark企业级实战版>, 另外还有一本<Spark大数据处理:技术.应用与性能优化(全)> 先看前一篇. 根据书里的前言里面,对于阅读顺序的建议.先看最后的S ...

  5. Python金融大数据分析PDF

    Python金融大数据分析(高清版)PDF 百度网盘 链接:https://pan.baidu.com/s/1CF2NhbgpMroLhW2sTm7IJQ 提取码:clmt 复制这段内容后打开百度网盘 ...

  6. Tech 助力Fin ,大数据风控系统赋能掌众金服!

    胡亚海 首席技术官  CTO 北京航空航天大学  博士 深耕互联网领域近20年,先后任职于普天信息技术研究院.摩托罗拉.宇龙酷派.百度等知名企业,曾主导宇龙酷派公司全员从WinCE向Android转型 ...

  7. 个人永久性免费-Excel催化剂功能第98波-零代码零距离轻松接触并拥有金融大数据

    数据产生价值的一个最突出的领域-金融领域,股票.证券.上市公司财务报表等,多少人在其中发掘出宝贵的数据价值.今天Excel催化剂联合Tushare金融大数据平台,让这一切的数据都能成为你我普通人零代码 ...

  8. 《Python金融大数据分析》高清PDF版|百度网盘免费下载|Python数据分析

    <Python金融大数据分析>高清PDF版|百度网盘免费下载|Python数据分析 提取码:mfku 内容简介 唯一一本详细讲解使用Python分析处理金融大数据的专业图书:金融应用开发领 ...

  9. python金融大数据分析PDF高清完整版免费下载|百度云盘|Python基础教程免费电子书

    点击获取提取码:7k4b 内容简介 唯一一本详细讲解使用Python分析处理金融大数据的专业图书:金融应用开发领域从业人员必读. Python凭借其简单.易读.可扩展性以及拥有巨大而活跃的科学计算社区 ...

  10. 人物传记Kyle Tedford:数据环境生变,银行大数据风控怎么办?

    数据是金融业务的基石,监管集中清查大数据公司,很多东西在发生根本性改变,资金方做"甩手掌柜"的好日子不会重现.那些缺乏自主风控能力的金融机构,在未来的行业竞争中,恐无以立足了.近日 ...

随机推荐

  1. 五子棋 framebuffer版

    要在家目录下 makefile 1 main : main.o fun.o input.o fb_draw.o 2 gcc -Wall -o $@ $^ 3 clean : 4 rm -rf *.o ...

  2. vue3中inject无法获取provide传递的最新的值

    // 爷组件  import { defineComponent, reactive, toRefs, onMounted, provide ,computed} from 'vue';  const ...

  3. 可以编译驱动,编译ch34x驱动后,不能编译驱动了

    编译驱动时,得先把内核编译好: 已经成功编译了01驱动: 后来编译ch34x驱动,发现编译不成功: 然后再编译01驱动也不成功了: 再次编译内核,再编译01就能编译了: 能力有限,不知道为什么,记录下 ...

  4. python 循环与判断

    import random #导入模块import stringcount = 1 #计数器while count < 4: #循环(while : 当) for i in range(1): ...

  5. elasticsearch 内存分配设置

    一.背景 elasticsearch版本为2.3.3 elasticsearch 默认安装后设置的内存是1GB,对于现实业务来说太小 预计在五台机器上配置elasticsearch构建集群,但是构建索 ...

  6. Java学习笔记(二)java流程控制

    学习笔记2 Java流程控制 这次也是跟着[狂神说Java]Java零基础学习视频通俗易懂继续学习的,持续学习,你我共勉. 一. 用户交互Scanner 1. Scanner对象 之前学的基本语法没有 ...

  7. Day 23 23.2.1:微信公众平台案例

    微信公众平台案例 注意:接下来将的内容,请忽视具体网站,重点专注逆向的分析思路! 接下来就是爬什么网站,什么数据,什么形式都统统不重要!重点是分析思路 微信公众平台案例 url:https://mp. ...

  8. 在orangepi 3 lts上使用SmartCardReader(读卡器)

    前期工作 orangepi 3 lts使用全志的H6芯片,通过查询该芯片的datasheet和user manual,可以发现H6有两个scr接口,分别为scr0和scr1,理论上是支持读卡器接口的, ...

  9. TensorFlow中使用tf.keras.callbacks.EarlyStopping防止训练过拟合

    TensorFlow tf.keras.callbacks.EarlyStopping 当模型训练次数epoch设置到100甚至更大时,如果模型的效果没有进一步提升,那么训练可以提前停止,继续训练很可 ...

  10. 判断js对象每个字段是否为空

    for(var key in obj) { if (!obj[key])return; }