作者 Jonathan
Allen
 ,译者 张晓鹏

Splunk的用户大会已经接近尾声。三天时间的会议里,共进行了160多个主题研讨。涵盖了从安全、运营到商业智能。甚至包含物联网,会议中一遍又一遍出现同样的中心主题:大数据的关键是机器学习。

存储不再是一个问题。

从执行Hadoop兼容节点的专用存储硬件。到数百台使用普通硬盘的计算机组成的集群,毫无疑问,我们具备了处理这类存储问题的能力。还有一方面,像Splunk这种分析和可视化工具也应运而生。假设你知道你要找什么,这些工具能够非常快给你所须要的答案。

可是,你应该找什么呢?对于绝大多数的基层供应商来说。问题的答案就在机器学习里面。不管你是在谈论网络流量、用户行为。或者是消费趋势,这都不要紧。你能真正洞察你所监控的东西的方式是找到数据中的模式和相关性。

尽管人类操作员能够通过试错法蹒跚而行,但他们相信,能够通过训练计算机来得到结果。而且速度更快和不带偏见。

当然,这并非说人类已经过时。必须有人来确认相关性不仅仅是种巧合,并找出对信息採取行动的方法。而这也正是前面所提到的可视化工具能够发挥作用的地方。

大数据和机器学习的主要用例

尽管大数据的潜力差点儿是无限的,但不可避免的是一或两个行业会在前面带头冲锋。

假设再过一年问我。我可能会说不同的话,但如今的预測是,不管是安全还是运营。都会处在第一线。

仅仅要比那些仅仅收现金的咖啡亭大的公司,都须要考虑信息的安全性。即使他们没有知识产权可言。但他们都在处理一些敏感信息,如信用卡号码。

有方法能够可靠地检測和阻止那些正在发生的违约行为,对公司的长期成功是至关重要的。基于机器学习的安全产品承诺提供这样的能力,而且它的易用性接近“交钥匙project(译者注:意为卖方把全部事情都做好了,买方仅仅要拿钥匙验收就能够了)”的水准。

与此类似,运营分析将会流行起来。如今你就能够买到工具来监视你的网络,解码数据包,或向你精确呈现一个给定的REST调用是怎样经过server的中间层一路到达数据库或文件系统的。然后把它和一周。一个月或一年曾经的行为做对照。

这不是未来的概念,而是今天现成的东西,并能够在一周内执行起来。

其他领域的研究将会继续下去。但不会有如此快的速度。欺诈检測是很重要的,但大多数公司会依靠他们的金融机构来设计和实施必要的控制措施。我估计在这方面不会有太多商业化的、现成的产品。

商业智能是还有一个会看到大量金钱投入的研究领域。但可口可乐与百事可乐公司用来确定下一个流行口味的算法,看起来一点也不像通用和福特公司用来预測每种尺寸的车型会有多少量的算法。如此类推。商业化产品对大数据的运用眼下可能会主要局限于主要的分析和可视化方面。

其它的会议思考

总而言之。Splunk举办了一次非常好的会议。一切都组织得非常好,每一个人,从刚開始学习的人到最高级的数据挖掘project师,都会有相关的议题研讨。我唯一的抱怨是。议题研讨没有记录。由于有这么多的内容,人们势必会由于冲突错过一两个重要的议题。

即使你对Splunk本身不感兴趣。但对大数据、机器学习以及相关主题感兴趣的不论什么人来说。这都是一次重要的会议。

查看英文原文:Splunk
Conference Recap: The Key to Big Data is Machine Learning

Splunk 会议回想: 大数据的关键是机器学习的更多相关文章

  1. 第四届CCF大数据学术会议征文通知

    第四届CCF大数据学术会议征文通知 2016年10月,兰州 近几年,大数据是各界高度关注积极布局的热点方向.2015年8月,国务院发表<促进大数据发展行动纲要>,正式将大数据提升为国家战略 ...

  2. 追本溯源 解析“大数据生态环境”发展现状(CSDN)

    程学旗先生是中科院计算所副总工.研究员.博士生导师.网络科学与技术重点实验室主任.本次程学旗带来了中国大数据生态系统的基础问题方面的内容分享.大数据的发展越来越快,但是对于大数据的认知大都还停留在最初 ...

  3. [Hadoop 周边] Hadoop和大数据:60款顶级大数据开源工具(2015-10-27)【转】

    说到处理大数据的工具,普通的开源解决方案(尤其是Apache Hadoop)堪称中流砥柱.弗雷斯特调研公司的分析师Mike Gualtieri最近预测,在接下来几年,“100%的大公司”会采用Hado ...

  4. Hadoop和大数据:60款顶级大数据开源工具

    一.Hadoop相关工具 1. Hadoop Apache的Hadoop项目已几乎与大数据划上了等号.它不断壮大起来,已成为一个完整的生态系统,众多开源工具面向高度扩展的分布式计算. 支持的操作系统: ...

  5. 【转载】Hadoop和大数据:60款顶级大数据开源工具

    一.Hadoop相关工具 1. Hadoop Apache的Hadoop项目已几乎与大数据划上了等号.它不断壮大起来,已成为一个完整的生态系统,众多开源工具面向高度扩展的分布式计算. 支持的操作系统: ...

  6. 大数据,why python

    大数据,why python ps, 2015-12-4 20:47:46 python" title="大数据,why python">http://www.op ...

  7. Hadoop和大数据:60款顶级开源工具(山东数漫江湖)

    说到处理大数据的工具,普通的开源解决方案(尤其是Apache Hadoop)堪称中流砥柱.弗雷斯特调研公司的分析师Mike Gualtieri最近预测,在接下来几年,“100%的大公司”会采用Hado ...

  8. 从技术 Leader 的招聘需求看,如何转岗为当前紧缺的大数据相关人才?

    前段时间,跟候选人聊天的时候,一个有多年工作经验的资深 iOS 工程师告诉我,他最近正在学习 Machine Learning 相关的知识.他觉得,对于程序员来说,技术进步大大超过世人的想象,如果你不 ...

  9. 工信部<<大数据产业发展规划>>

    大数据产业发展规划 (2016-2020年) 发布时间:2017-01-17  来源:规划司 数据是国家基础性战略资源,是21世纪的“钻石矿”.党中央.国务院高度重视大数据在经济社会发展中的作用,党的 ...

随机推荐

  1. 2.docker容器

    docker run 镜像,生成镜像容器,并运行 有以下参数 --name="new name",为容器指定一个新名字 -d:后台运行容器,返回容器id,即启动守护式容器 -i:以 ...

  2. 使用System.getProperty("line.separator")时没有换行问题解决

    项目中要实现替换模版txt文本里面的内容,然后生成新的文档,其中先把模版文本的内容通过创建的 BufferedReader bufReader 使用 readLine() 来一行一行读取,所以在完成替 ...

  3. rest-framework-@action()装饰器

    路由Routers 使用方法:   在urls.py中定义路由 from rest_framework.routers import DefaultRouter # 定义视图集的路由 router = ...

  4. XAMPP配置vhosts多站点/绝对正确

    XAMPP有时候你需要一些顶级域名访问方式来访问你本地的项目也就是虚拟主机配置,这时候就需要配置虚拟主机,给你的目录绑定一个域名,实现多域名绑定访问. 在Mac 下一直使用 MAMP 搭建本地 php ...

  5. [BZOJ2553][BeiJing2011]禁忌 dp+AC自动机+矩阵快速幂

    2553: [BeiJing2011]禁忌 Time Limit: 20 Sec  Memory Limit: 128 MBSec  Special JudgeSubmit: 1206  Solved ...

  6. Codeforces Round #403 (Div. 2, based on Technocup 2017 Finals )D. Innokenty and a Football League(2-sat)

    D. Innokenty and a Football League time limit per test 2 seconds memory limit per test 256 megabytes ...

  7. UVA548 Tree (二叉树的遍历)

    You are to determine the value of the leaf node in a given binary tree that is the terminal node of ...

  8. [BZOJ2823][BZOJ1336][BZOJ1337]最小圆覆盖(随机增量法)

    算法介绍网上有很多,不解释了. 给出三点坐标求圆心方法:https://blog.csdn.net/liyuanbhu/article/details/52891868 记得先random_shuff ...

  9. Codeforces 920 F SUM and REPLACE

    Dicription Let D(x) be the number of positive divisors of a positive integer x. For example, D(2) =  ...

  10. 【记忆化搜索】bzoj1048 [HAOI2007]分割矩阵

    标准差=√(Σ(xi-xba)2/n)=Σ(xi)2+xba*n-2*xba*sum.只需最小化每个分割出来的矩阵的平方和即可. #include<cstdio> #include< ...