大数据、AI“武装”企业服务:风控、检索、安全

  +

- 文|吴杨可月 -

- 小饭桌创业研究院出品 -

  两件秘闻,将美国大数据公司Palantir从幕后推向前台——

  一是,Palantir的旗下产品在整合40年的记录及海量数据并充分挖掘之后,找到了前纳斯达克主席麦道夫“庞氏骗局”的大量确凿证据;

  二是,通过其大数据挖掘能力,Palantir帮美国政府找到本拉登的老巢。

  人们这才惊叹的发现,这家低调且离大众很远的公司,估值已经超过200亿美元。

  事实上,在中国,越来越多像Palantir这样服务于机构的大数据、AI公司,正在各个领域和赛道上涌现。风控、检索、安全、营销,都有他们的身影蛰伏其后,发挥越来越关键性的作用,甚至左右市场的波动。

  本研究对大数据、AI中的企业服务机会进行详尽的分析,通过与国外该领域的对比,梳理其中的投资机遇。

  数据处理的新进展,带来应用层面的新机会

  ? 新进展:数据融合、非结构数据处理能力

  AI的底层是特征标记,革新意义就在于能处理文本图片声音非结构数据,从而将研报政策舆情行为情绪等更多维度的信息纳入可供分析的范畴。

  数据融合则是将不同来源不同结构不同模态数据放在同一个模型分析。

  ? 新机会:风控、检索、安全、营销

  国内基础设施需求与国外不同,机会更多来自可以直接降低损失带来收益的方向。

  ◆◆

  1、风控

  从Palantir、Anaplan看国外大数据风控应用

  (数据来源:Crunchbase,公开信息整理)

  1.风险辅助识别——海量样本中快速发现异常

   国外公司:Palantir的工作原理——反恐(找出恐怖分子)为例

   国内公司:氪信的工作原理——金融为例

  功能:优化现有风控效率,但不具备完全风控定价能力

  ? 有机会从“第三方”做到“直接借贷”

  通常情况,“直接借贷”的收益,显著优于“第三方”数据服务提供方。

  数据获取+数据分析——具备风控定价能力,即可做“直接借贷”。

  路径一:接入丰富的借贷方数据源

  -典型代表:第三方征信公司。

  路径二:累积足够的异常数据,具备通过“旧风险”推知“新风险”的能力

  -典型代表:基于AI的数据分析公司

  -一些难点:

  Ø所累计的数据,只有结果没有推导过程

  Ø基于AI的分析,不具备迁移学习能力,拓展性有限

  2.舆情监测——增加风控维度

  舆情监测的价值——快人一步、真假判定、“In control”

  典型应用领域:金融、公关、媒体、企业安全、政府……

  Dataminr:发现“小道消息”里的真消息,“大新闻”里的假消息

  -案例一:“小道消息”里的真消息

  Ø独立记者Brian在Twitter上发消息称家得宝“可能会是信用卡违约的新受害者”

  ØDataminr系统立刻识别出此消息的价值

  ØDataminr将此消息传达给客户,包括60家银行和对冲基金

  ØDataminr的速度比财经新闻快了15分钟,且赶在家得宝股价下降2%

  -案例二:“大新闻”里的假消息

  Ø有推文发送白宫有炸弹的假消息,造成道金斯工业指数数分钟内下滑145

  ØDataminr连续进行2次假消息预警:第1次,指出信息是从被黑账号发出;第2次,分析白宫附近的实时推文,判定称该消息可能是假的

  (数据来源:公开信息整理)

  3.经营规划——打通多维数据,精准解析

  ? Anaplan:跨部门收集数据,简易关联,指导未来决策

  接入企业内部运营数据,进行数据关联,并通过模型,指导未来决策

  -优势:

  Ø简易的数据关联——将财务、销售、人力等独立的数据融合在一起

  ?无需IT人员,即可完成模型的搭建、挖掘、维护、分享

  ?云端电子表格:Excel功能+多组共同操作

  Ø预测模型——搭建运营数据与未来规划的桥梁

  -用户覆盖:16个国家设立办公室,660家公司,100,000+个用户

  (数据来源:Anaplan官网)

  ◆◆

  检索

  从Kensho、Watson看国外大数据检索应用

  (数据来源:Crunchbase)

  1.投研——提升信息量、效率、便捷性

  ? 基于海量信息,模拟分析师分析过程

  基于海量信息——以Kensho为例

  模拟分析师分析过程

  -根据数据库中某资产价格的变动历史,提取出影响该资产价格的所有可能变量

  -通过特征选择算法,选择出和当期资产价格波动较为相关的变量

  -通过机器扫描所有和这些变量相关的数据源

  -将变量值输入模型,从而得出资产价格的波动区间,以及变量的影响因子

  (数据来源:公开信息整理)

  ? Kensho的傻瓜式应用:“事件——结果”直接呈现

  功能:

  -追因:什么因素影响了股价变动?

  -预测:某一因素会对股价造成什么影响?

  -程度:呈现众多因素下,股价/指数变动的幅度

  金融机构愿意买单:又买产品又投钱

  Kensho为例:高盛、JP摩根、美林、摩根史丹利、花旗、标普——既是它的用户,也是它的投资方

  2.理赔——比对理赔要求和赔偿标准

  价值:提高理赔效率,减少错误,降低风险

  案例——IBMWatson服务日本富国生命保险进行健康险理赔

  -成本:系统引入$170+维持费用$12.8/

  -效益:预期节省开支$110/;拟减少员工30%

  (数据来源:公开信息整理)

  3.审计——比对财务信息和审计标准

  Sway Finance——财务信息快速检索工具

  -直接把经营活动转化为财务信息,并可随时检索信息、比对合规性

  4.内控——比对员工行为和法律/公司规范

  ? Behavox:发现高风险或违规活动

  价值:及时、高效发现高风险或违规活动

  -及时——防患于未然

  -高效——极大减少合规检查需耗费的时间、人力成本

  方法:从交易员与客户、交易员之间的沟通中,捕捉偏离常规的细节

  (数据来源:Behavox官网)

  合规性检测的原理是比对验证

  知识库比对要尽量应用在高ROI的领域

  比较好的应用领域:

  另,样本的可获取性以及获取成本也是一个附加条件,医疗辅诊领域就需要攻克这个难点。

  国外,理赔、内控领域的应用已快速铺开,审计尚不明朗;国内,目前集中在理赔。

  ◆◆

  安全

  从Splunk、Datto看国外大数据安全应用

  (数据来源:雪球2017.4.实时数据,Splunk annual report 2017,Crunchbase,公开信息整理)

  1.日志分析——跨越不连续性的根本性分析

  ? Splunk:机器数据的引擎——聚合、搜索、可视化

  面向细分市场——Machine Log(日志数据为主)分析,并在上面集成了完整的专用模块

  所有应用都是相对专门的领域,因此可以进行专门优化

  ? 机器数据的特点——跨越不连续性、快速增长、基础&根本

  特点一:跨越不连续性

  -跨越系统的不连续性:可收集、索引、利用所有应用程序服务器设备等在物理虚拟中生成的数据

  -跨越时间的不连续性:分析所有实时历史数据

  特点二:快速增长

  -以Splunk为例,其营收已达到$9亿,仍有望保持50%的增速

  特点三:基础&根本——基于端对端基础结构,从复杂事件中获取新层次的运营可见性

  (数据来源:Splunk财务年报2017)

  ? Splunk的应用:瞬时解决安全问题、优化服务性能

  核心能力:抽象数据、应用领域之间的理解处理能力

  典型用户

  解决安全问题:一站式搜索、分析——快速、全面发现问题

  优化服务性能:检测端对端基础结构——优化服务性能、业务流程

  2.容灾——快速备份,一键还原到特定时期

  ? Datto:给予小型企业“防弹”级别的数据备份服务

  容灾:将应用产生的数据进行存储+灾备——应对数据丢失和意外灾害(被黑)

  面向:中小企业

  费用:初装 + 按流量计的月费

  多项技术优势

  (数据来源:公开信息整理)

  ? 机遇与挑战并存:替换成本高、国内市场空白,但技术门槛高

  替换成本高——构建竞争壁垒

  国内市场空白

  通过技术实现以下功能

  (数据来源:初装费/月费借鉴Datto收费标准,公开信息整理)

  3.反作弊——排除欺诈、垃圾产生的干扰

  国外案例:Signifyd

  功能:帮助客户避免因欺诈、退款、操作失误产生的损失及资源浪费

  应用:电商

  价值:让客户够安心的快速扩张

  国内案例:数美科技

  产品:

  应用:文娱、电商、金融

  ◆◆

  营销

  从Sprinklr、Hubspot看国内外大数据营销应用

  (数据来源:雪球2017.4.实时数据,Crunchbase,公开信息整理)

  1.社交营销——跨平台整合式营销

  ? Sprinklr:社交媒体跨平台整合管理工具和服务

  在一个平台上同时进行多个社交媒体上的营销管理——分析数据开展营销活动了解用户体验

  -19个社交媒体管理模块

  -20+社交渠道:Facebook、Twitter、LinkedIn、YouTube、人人网、微博等

  用户:

  -《财富》Top 50中一半的公司

  -1,200多个品牌商

  (数据来源:Sprinklr官网,公开信息整理)

  功能例举:基于传播属性的数据分析

  广告分析工具:记录提及、点赞、分享、评论信息——效果评估

  功能例举:有计划的开展内容营销

  内容规划和发布工具:内容制作——找寻目标并发布——资源管理——效果监测

  功能例举:互动式用户体验管理

  用户体验管理工具:持续地创建、管理、优化有价值的用户体验

  ? Sprinklr通过多起收购,补全营销能力

  2.集客营销——吸引、转化、提升的全周期

  ? Hubspot:帮助提供有价值的内容,提高流量转化率,促进交易达成

  丰富全面的产品功能

  典型应用:中小渠道商、服务商

  不过,国内的渠道流量都集中在几个大的电商平台(阿里、京东、美团),传统服务领域品牌化、线上化、流程化不足,目前能用到集客营销工具的公司比较少

  3.精准营销——找到对的人、产品、方式

  ? 第四范式:通过数据学习精准定位潜在用户、适合产品、成本投入

  案例一:精准定位潜在用户

  案例二:精准定位适合产品

  案例三:精准定位成本投入

  (数据来源:第四范式官网)

  尾声:大数据、AI类企业服务公司的特点

  业务综合:数据分析的底层工作原理类似,一个公司会同时切到多个不相关的领域

  咨询服务VS产品:数据类企业服务,虽然也涉及产品,但很多更倾向于卖咨询服务,与传统企业服务(CRM、OA、HR…)卖产品、卖维护服务的特点不一样。

伴随而来的新现象:Palantir也是面向大B,但公司没有销售、BD团队

  高富帅行业:

  -技术背景豪华:MIT、前FB工程师

  -需要对业务有更深的理解:Behavox的创始人是前高盛分析师;Palantir的创始人广泛游走于律师、金融,还是《从0到1》的作者

大数据、AI“武装”企业服务:风控、检索、安全的更多相关文章

  1. 七牛云杜江华:让云 + AI 成为企业服务的标配

    12 月 5-6 日,2018 创业邦 100 未来领袖峰会暨创业邦年会(以下简称「创业邦 100 未来领袖峰会」)在北京国家会议中心举行.12 月 5 日下午,七牛云执行副总裁杜江华在企业服务论坛上 ...

  2. 大数据给IT企业带来攫金市场新机遇

    大数据给IT企业带来攫金市场新机遇 大数据,一个时髦的名词,也是当下热门的业务领域.大数据诱人的利益诉求点之一,即通过大数据能更好地提高效率,更好地有的放矢.一方面,大数据让公司内部更有效地运作:另一 ...

  3. 贾扬清谈大数据&AI发展的新挑战和新机遇

    摘要:2019云栖大会大数据&AI专场,阿里巴巴高级研究员贾扬清为我们带来<大数据AI发展的新机遇和新挑战>的分享.本文主要从人工智能的概念开始讲起,谈及了深度学习的发展和模型训练 ...

  4. 【大数据实战】Logstash采集->Kafka->ElasticSearch检索

    1. Logstash概述 Logstash的官网地址为:https://www.elastic.co/cn/products/logstash,以下是官方对Logstash的描述. Logstash ...

  5. 服务端、实时、大数据、AI计算

    服务端.实时.大数据.AI计算,各种各样的计算,计算机本质是什么,计算机的本质是 利用compute的计算速度为人提供更优的计算结果. 所以实时也好,准实时.离线.AI本质上是两个维度,实时准实时强调 ...

  6. 以P2P网贷为例互联网金融产品如何利用大数据做风控?

    以P2P网贷为例互联网金融产品如何利用大数据做风控?   销售环节 了解客户申请意愿和申请信息的真实性:适用于信贷员模式. 风控关键点 亲见申请人,亲见申请人证件,亲见申请人签字,亲见申请人单位. 审 ...

  7. AI加持的阿里云飞天大数据平台技术揭秘

    摘要:2019云栖大会大数据&AI专场,阿里云智能计算平台事业部研究员关涛.资深专家徐晟来为我们分享<AI加持的阿里云飞天大数据平台技术揭秘>.本文主要讲了三大部分,一是原创技术优 ...

  8. Day1 - 认识大数据& 企业需求分析 & 北风网简介

    上午: 介绍: 海量的乱七八糟的数据中快速的计算出某些有用的信息 刑侦视频追踪 云栖大会 大数据分析/挖掘 ==>  python  <== 重点关注 大数据运维   ==> 运服务 ...

  9. 奇点云数据中台技术汇(一) | DataSimba——企业级一站式大数据智能服务平台

    在这个“数据即资产”的时代,大数据技术和体量都有了前所未有的进步,若企业能有效使用数据,让数据赚钱,这必将成为企业数字化转型升级的有力武器. 奇点云自研的一站式大数据智能服务平台——DataSimba ...

随机推荐

  1. HDU 2167 状压dp方格取数

    题意:给出一个数表,规定取出一个数后周围的八个数都不可取,求可获得的最大数字和 思路:状态压缩dp,每一行的取数方法为状态,显然,由于取数规则的限制,可取的状态并不是 1<<size_co ...

  2. ATC/TC/CF

    10.25 去打 CF,然后被 CF 打了. CF EDU 75 A. Broken Keyboard 精神恍惚,WA 了一发. B. Binary Palindromes 比赛中的憨憨做法,考虑一个 ...

  3. unity3D笔记の四种调用其他脚本方法

    第一种,被调用脚本函数为static类型,调用时直接用  脚本名.函数名() 第二种,GameObject.Find("脚本所在的物体的名字").SendMessage(" ...

  4. PHP算法之IP 地址无效化

    给你一个有效的 IPv4 地址 address,返回这个 IP 地址的无效化版本. 所谓无效化 IP 地址,其实就是用 "[.]" 代替了每个 ".". 示例 ...

  5. spring整合Quartz框架过程,大家可以参考下

    这篇文章详细介绍了spring集成quartz框架流程,通过示例代码进行了详细说明,对学习或任务有参考学习价值,并可供需要的朋友参考. 1.quartz框架简介(m.0831jl.com) quart ...

  6. for循环和字典预习

    print("*" *8)for a in range(1,9): print(a,end="")#1-9的奇数print()for a in range(1, ...

  7. AIO 详解

    AIO(Asynchronous Input and Output) 异步IO则采用"订阅-通知"模式: 即应用程序向操作系统注册IO监听,然后继续做自己的事情. 当操作系统发生I ...

  8. Java基本语法.part02

    变量 变量的概念: 内存中的一个存储区域 该区域有自己的名称(变量名)和类型(数据类型) Java中每个变量必须先声明,后使用 该区域的数据可以在同一类型范围内不断变化 使用变量注意: 变量的作用域: ...

  9. Delphi定时模拟键盘按键例程

    delphi模拟键盘按键实例delphi模拟键盘按键实例,只是模拟一个按键的例子而已.到一定时间按下模拟按下一个按键,delphi7编译通过. 10秒点击一下H键,其他键你们去找数值替换吧,网上大把的 ...

  10. 什么是存根类 Stub

    转:http://www.cnblogs.com/cy163/archive/2009/08/04/1539077.html 存根类是一个类,它实现了一个接口,但是实现后的每个方法都是空的.      ...