大数据、AI“武装”企业服务:风控、检索、安全
+
- 文|吴杨可月 -
- 小饭桌创业研究院出品 -
两件秘闻,将美国大数据公司Palantir从幕后推向前台——
一是,Palantir的旗下产品在整合40年的记录及海量数据并充分挖掘之后,找到了前纳斯达克主席麦道夫“庞氏骗局”的大量确凿证据;
二是,通过其大数据挖掘能力,Palantir帮美国政府找到本拉登的老巢。
人们这才惊叹的发现,这家低调且离大众很远的公司,估值已经超过200亿美元。
事实上,在中国,越来越多像Palantir这样服务于机构的大数据、AI公司,正在各个领域和赛道上涌现。风控、检索、安全、营销,都有他们的身影蛰伏其后,发挥越来越关键性的作用,甚至左右市场的波动。
本研究对大数据、AI中的企业服务机会进行详尽的分析,通过与国外该领域的对比,梳理其中的投资机遇。
数据处理的新进展,带来应用层面的新机会
? 新进展:数据融合、非结构数据处理能力
AI的底层是特征标记,革新意义就在于能处理文本、图片、声音等非结构数据,从而将研报、政策、舆情、行为、情绪等更多维度的信息纳入可供分析的范畴。
数据融合则是将不同来源、不同结构、不同模态的数据放在同一个模型里分析。
? 新机会:风控、检索、安全、营销
国内基础设施和需求与国外不同,机会更多来自可以直接降低损失、带来收益的方向。
◆◆◆
1、风控
从Palantir、Anaplan看国外大数据风控应用
(数据来源:Crunchbase,公开信息整理)
1.风险辅助识别——海量样本中快速发现异常
国外公司:Palantir的工作原理——反恐(找出恐怖分子)为例
国内公司:氪信的工作原理——金融为例
功能:优化现有风控效率,但不具备完全风控定价能力
? 有机会从“第三方”做到“直接借贷”
通常情况,“直接借贷”的收益,显著优于“第三方”数据服务提供方。
数据获取+数据分析——具备风控定价能力,即可做“直接借贷”。
路径一:接入丰富的借贷方数据源
-典型代表:第三方征信公司。
路径二:累积足够的异常数据,具备通过“旧风险”推知“新风险”的能力
-典型代表:基于AI的数据分析公司
-一些难点:
Ø所累计的数据,只有结果,没有推导过程
Ø基于AI的分析,不具备迁移学习能力,拓展性有限
2.舆情监测——增加风控维度
舆情监测的价值——快人一步、真假判定、“In control”
典型应用领域:金融、公关、媒体、企业安全、政府……
Dataminr:发现“小道消息”里的真消息,“大新闻”里的假消息
-案例一:“小道消息”里的真消息
Ø独立记者Brian在Twitter上发消息称家得宝“可能会是信用卡违约的新受害者”
ØDataminr系统立刻识别出此消息的价值
ØDataminr将此消息传达给客户,包括60家银行和对冲基金
ØDataminr的速度比财经新闻快了15分钟,且赶在家得宝股价下降2%前
-案例二:“大新闻”里的假消息
Ø有推文发送白宫有炸弹的假消息,造成道金斯工业指数数分钟内下滑145点
ØDataminr连续进行2次假消息预警:第1次,指出信息是从被黑账号发出;第2次,分析白宫附近的实时推文,判定称该消息可能是假的
(数据来源:公开信息整理)
3.经营规划——打通多维数据,精准解析
? Anaplan:跨部门收集数据,简易关联,指导未来决策
接入企业内部运营数据,进行数据关联,并通过模型,指导未来决策
-优势:
Ø简易的数据关联——将财务、销售、人力等独立的数据融合在一起
?无需IT人员,即可完成模型的搭建、挖掘、维护、分享
?云端电子表格:Excel功能+多组共同操作
Ø预测模型——搭建运营数据与未来规划的桥梁
-用户覆盖:16个国家设立办公室,660家公司,100,000+个用户
(数据来源:Anaplan官网)
◆◆◆
检索
从Kensho、Watson看国外大数据检索应用
(数据来源:Crunchbase)
1.投研——提升信息量、效率、便捷性
? 基于海量信息,模拟分析师分析过程
基于海量信息——以Kensho为例
模拟分析师分析过程
-根据数据库中某资产价格的变动历史,提取出影响该资产价格的所有可能变量
-通过特征选择算法,选择出和当期资产价格波动较为相关的变量
-通过机器扫描所有和这些变量相关的数据源
-将变量值输入模型,从而得出资产价格的波动区间,以及变量的影响因子
(数据来源:公开信息整理)
? Kensho的傻瓜式应用:“事件——结果”直接呈现
功能:
-追因:什么因素影响了股价变动?
-预测:某一因素会对股价造成什么影响?
-程度:呈现众多因素下,股价/指数变动的幅度
金融机构愿意买单:又买产品又投钱
以Kensho为例:高盛、JP摩根、美林、摩根史丹利、花旗、标普——既是它的用户,也是它的投资方
2.理赔——比对理赔要求和赔偿标准
价值:提高理赔效率,减少错误,降低风险
案例——IBM的Watson服务日本富国生命保险进行健康险理赔
-成本:系统引入$170万+维持费用$12.8万/年
-效益:预期节省开支$110万/年;拟减少员工30%
(数据来源:公开信息整理)
3.审计——比对财务信息和审计标准
Sway Finance——财务信息快速检索工具
-直接把经营活动转化为财务信息,并可随时检索信息、比对合规性
4.内控——比对员工行为和法律/公司规范
? Behavox:发现高风险或违规活动
价值:及时、高效发现高风险或违规活动
-及时——防患于未然
-高效——极大减少合规检查需耗费的时间、人力成本
方法:从交易员与客户、交易员之间的沟通中,捕捉偏离常规的细节
(数据来源:Behavox官网)
合规性检测的原理是比对验证
知识库比对要尽量应用在高ROI的领域
比较好的应用领域:
另,样本的可获取性以及获取成本也是一个附加条件,医疗辅诊领域就需要攻克这个难点。
国外,理赔、内控领域的应用已快速铺开,审计尚不明朗;国内,目前集中在理赔。
◆◆◆
安全
从Splunk、Datto看国外大数据安全应用
(数据来源:雪球2017.4.实时数据,Splunk annual report 2017,Crunchbase,公开信息整理)
1.日志分析——跨越不连续性的根本性分析
? Splunk:机器数据的引擎——聚合、搜索、可视化
面向细分市场——Machine Log(日志数据为主)分析,并在上面集成了完整的专用模块
所有应用都是相对专门的领域,因此可以进行专门优化
? 机器数据的特点——跨越不连续性、快速增长、基础&根本
特点一:跨越不连续性
-跨越系统的不连续性:可收集、索引、利用所有应用程序、服务器、设备等在物理、虚拟、云中生成的数据
-跨越时间的不连续性:分析所有实时、历史数据
特点二:快速增长
-以Splunk为例,其营收已达到$9亿,仍有望保持50%的增速
特点三:基础&根本——基于端对端基础结构,从复杂事件中获取新层次的运营可见性
(数据来源:Splunk财务年报2017)
? Splunk的应用:瞬时解决安全问题、优化服务性能
核心能力:抽象数据、应用领域之间的理解处理能力
典型用户
解决安全问题:一站式搜索、分析——快速、全面发现问题
优化服务性能:检测端对端基础结构——优化服务性能、业务流程
2.容灾——快速备份,一键还原到特定时期
? Datto:给予小型企业“防弹”级别的数据备份服务
容灾:将应用产生的数据进行存储+灾备——应对数据丢失和意外灾害(被黑)
面向:中小企业
费用:初装 + 按流量计的月费
多项技术优势
(数据来源:公开信息整理)
? 机遇与挑战并存:替换成本高、国内市场空白,但技术门槛高
替换成本高——构建竞争壁垒
国内市场空白
通过技术实现以下功能
(数据来源:初装费/月费借鉴Datto收费标准,公开信息整理)
3.反作弊——排除欺诈、垃圾产生的干扰
国外案例:Signifyd
功能:帮助客户避免因欺诈、退款、操作失误产生的损失及资源浪费
应用:电商
价值:让客户够安心的快速扩张
国内案例:数美科技
产品:
应用:文娱、电商、金融
◆◆◆
营销
从Sprinklr、Hubspot看国内外大数据营销应用
(数据来源:雪球2017.4.实时数据,Crunchbase,公开信息整理)
1.社交营销——跨平台整合式营销
? Sprinklr:社交媒体跨平台整合管理工具和服务
在一个平台上同时进行多个社交媒体上的营销管理——分析数据,开展营销活动,了解用户体验
-19个社交媒体管理模块
-20+个社交渠道:Facebook、Twitter、LinkedIn、YouTube、人人网、微博等
用户:
-《财富》Top 50中一半的公司
-1,200多个品牌商
(数据来源:Sprinklr官网,公开信息整理)
功能例举:基于传播属性的数据分析
广告分析工具:记录提及、点赞、分享、评论信息——效果评估
功能例举:有计划的开展内容营销
内容规划和发布工具:内容制作——找寻目标并发布——资源管理——效果监测
功能例举:互动式用户体验管理
用户体验管理工具:持续地创建、管理、优化有价值的用户体验
? Sprinklr通过多起收购,补全营销能力
2.集客营销——吸引、转化、提升的全周期
? Hubspot:帮助提供有价值的内容,提高流量转化率,促进交易达成
丰富全面的产品功能
典型应用:中小渠道商、服务商
不过,国内的渠道流量都集中在几个大的电商平台(阿里、京东、美团),传统服务领域品牌化、线上化、流程化不足,目前能用到集客营销工具的公司比较少
3.精准营销——找到对的人、产品、方式
? 第四范式:通过数据学习精准定位潜在用户、适合产品、成本投入
案例一:精准定位潜在用户
案例二:精准定位适合产品
案例三:精准定位成本投入
(数据来源:第四范式官网)
尾声:大数据、AI类企业服务公司的特点
业务综合:数据分析的底层工作原理类似,一个公司会同时切到多个不相关的领域
咨询服务VS产品:数据类企业服务,虽然也涉及产品,但很多更倾向于卖咨询服务,与传统企业服务(CRM、OA、HR…)卖产品、卖维护服务的特点不一样。
伴随而来的新现象:Palantir也是面向大B,但公司没有销售、BD团队
高富帅行业:
-技术背景豪华:MIT、前FB工程师
-需要对业务有更深的理解:Behavox的创始人是前高盛分析师;Palantir的创始人广泛游走于律师、金融,还是《从0到1》的作者
大数据、AI“武装”企业服务:风控、检索、安全的更多相关文章
- 七牛云杜江华:让云 + AI 成为企业服务的标配
12 月 5-6 日,2018 创业邦 100 未来领袖峰会暨创业邦年会(以下简称「创业邦 100 未来领袖峰会」)在北京国家会议中心举行.12 月 5 日下午,七牛云执行副总裁杜江华在企业服务论坛上 ...
- 大数据给IT企业带来攫金市场新机遇
大数据给IT企业带来攫金市场新机遇 大数据,一个时髦的名词,也是当下热门的业务领域.大数据诱人的利益诉求点之一,即通过大数据能更好地提高效率,更好地有的放矢.一方面,大数据让公司内部更有效地运作:另一 ...
- 贾扬清谈大数据&AI发展的新挑战和新机遇
摘要:2019云栖大会大数据&AI专场,阿里巴巴高级研究员贾扬清为我们带来<大数据AI发展的新机遇和新挑战>的分享.本文主要从人工智能的概念开始讲起,谈及了深度学习的发展和模型训练 ...
- 【大数据实战】Logstash采集->Kafka->ElasticSearch检索
1. Logstash概述 Logstash的官网地址为:https://www.elastic.co/cn/products/logstash,以下是官方对Logstash的描述. Logstash ...
- 服务端、实时、大数据、AI计算
服务端.实时.大数据.AI计算,各种各样的计算,计算机本质是什么,计算机的本质是 利用compute的计算速度为人提供更优的计算结果. 所以实时也好,准实时.离线.AI本质上是两个维度,实时准实时强调 ...
- 以P2P网贷为例互联网金融产品如何利用大数据做风控?
以P2P网贷为例互联网金融产品如何利用大数据做风控? 销售环节 了解客户申请意愿和申请信息的真实性:适用于信贷员模式. 风控关键点 亲见申请人,亲见申请人证件,亲见申请人签字,亲见申请人单位. 审 ...
- AI加持的阿里云飞天大数据平台技术揭秘
摘要:2019云栖大会大数据&AI专场,阿里云智能计算平台事业部研究员关涛.资深专家徐晟来为我们分享<AI加持的阿里云飞天大数据平台技术揭秘>.本文主要讲了三大部分,一是原创技术优 ...
- Day1 - 认识大数据& 企业需求分析 & 北风网简介
上午: 介绍: 海量的乱七八糟的数据中快速的计算出某些有用的信息 刑侦视频追踪 云栖大会 大数据分析/挖掘 ==> python <== 重点关注 大数据运维 ==> 运服务 ...
- 奇点云数据中台技术汇(一) | DataSimba——企业级一站式大数据智能服务平台
在这个“数据即资产”的时代,大数据技术和体量都有了前所未有的进步,若企业能有效使用数据,让数据赚钱,这必将成为企业数字化转型升级的有力武器. 奇点云自研的一站式大数据智能服务平台——DataSimba ...
随机推荐
- HDU 2167 状压dp方格取数
题意:给出一个数表,规定取出一个数后周围的八个数都不可取,求可获得的最大数字和 思路:状态压缩dp,每一行的取数方法为状态,显然,由于取数规则的限制,可取的状态并不是 1<<size_co ...
- ATC/TC/CF
10.25 去打 CF,然后被 CF 打了. CF EDU 75 A. Broken Keyboard 精神恍惚,WA 了一发. B. Binary Palindromes 比赛中的憨憨做法,考虑一个 ...
- unity3D笔记の四种调用其他脚本方法
第一种,被调用脚本函数为static类型,调用时直接用 脚本名.函数名() 第二种,GameObject.Find("脚本所在的物体的名字").SendMessage(" ...
- PHP算法之IP 地址无效化
给你一个有效的 IPv4 地址 address,返回这个 IP 地址的无效化版本. 所谓无效化 IP 地址,其实就是用 "[.]" 代替了每个 ".". 示例 ...
- spring整合Quartz框架过程,大家可以参考下
这篇文章详细介绍了spring集成quartz框架流程,通过示例代码进行了详细说明,对学习或任务有参考学习价值,并可供需要的朋友参考. 1.quartz框架简介(m.0831jl.com) quart ...
- for循环和字典预习
print("*" *8)for a in range(1,9): print(a,end="")#1-9的奇数print()for a in range(1, ...
- AIO 详解
AIO(Asynchronous Input and Output) 异步IO则采用"订阅-通知"模式: 即应用程序向操作系统注册IO监听,然后继续做自己的事情. 当操作系统发生I ...
- Java基本语法.part02
变量 变量的概念: 内存中的一个存储区域 该区域有自己的名称(变量名)和类型(数据类型) Java中每个变量必须先声明,后使用 该区域的数据可以在同一类型范围内不断变化 使用变量注意: 变量的作用域: ...
- Delphi定时模拟键盘按键例程
delphi模拟键盘按键实例delphi模拟键盘按键实例,只是模拟一个按键的例子而已.到一定时间按下模拟按下一个按键,delphi7编译通过. 10秒点击一下H键,其他键你们去找数值替换吧,网上大把的 ...
- 什么是存根类 Stub
转:http://www.cnblogs.com/cy163/archive/2009/08/04/1539077.html 存根类是一个类,它实现了一个接口,但是实现后的每个方法都是空的. ...