一个打破神话的季节,正在降临.        我将坦诚地揭穿人们关于数据科学家所持有的惯有看法.在下文中,我将一个一个展示这些观点,宛如将一个又一个的玻璃瓶子摔碎在墙壁上一样.        关于数据科学家的神话主要是这些:        神话#1: 数据科学家们本身就是一种神奇生物,就像独角兽一样神奇叵測.        数据科学家实际上是很真实的.从人们開始进行多元统计分析.时间序列分析和运用其它核心分析方法时,他们就已经存在了.在某种程度上,假设你建立模型,并使用各种分析工具来找寻那些不显…
从今天开始,博主将用大概1000天的时间记录自己学习并成为初级数据科学家(数据分析师)的心路历程. 包括数据科学家所必需的的基础知识:数学,统计,计算机,商业,沟通能力等. 希望博主能够在2017前完成基本各个部分的汇总.形成一套数据科学家塑成指南. 下面是简要的数据科学家所具备的的知识结构:…
开源来自百度商业前端数据可视化团队的超漂亮动态图表--ECharts 本人项目中最近有需要图表的地方,偶然发现一款超级漂亮的动态图标js图表控件,分享给大家,觉得好用的就看一下.更多更漂亮的演示大家可以参考下面两个网址:ECharts官方网址:http://ecomfe.github.io/echarts/index.html,Why ECHarts:http://ecomfe.github.io/echarts/doc/slide/whyEcharts.html#/,官网有示例及各种帮助文档等…
小蚂蚁说: 11月8日,在第五届世界互联网大会-<人工智能:融合发展新机遇>论坛上,蚂蚁金服副总裁.首席数据科学家漆远认为AI具有控制风险.降本增效和提升用户体验三大作用. 11月8日,第五届世界互联网大会-<人工智能:融合发展新机遇>论坛顺利举行,蚂蚁金服副总裁.首席数据科学家漆远发表了关于AI的精彩观点.本文是精彩摘要. 蚂蚁金服副总裁.首席数据科学家漆远(右一) 漆远以蚂蚁金服为例,指出AI的作用是非常重要的.第一,可以通过AI控制风险,而风险是金融的核心所在:第二,AI可以…
摘要:R是数据科学家中最流行的编程语言和环境之一,在Spark中加入对R的支持是社区中较受关注的话题.作为增强Spark对数据科学家群体吸引力的最新举措,最近发布的Spark 1.4版本在现有的Scala/Java/Python API之外增加了R API(SparkR).SparkR使得熟悉R的用户可以在Spark的分布式计算平台基础上结合R本身强大的统计分析功能和丰富的第三方扩展包,对大规模数据集进行分析和处理.本文将回顾SparkR项目的背景,对其当前的特性作总体的概览,阐述其架构和若干技…
Coursera课程<数据科学家的工具箱> 约翰霍普金斯大学 Week3 Conceptual Issues Types of Questions Types of Data Science Questions 描述性分析(Descriptive) 在没有额外的统计建模的基础上,这些描述通常没什么普遍性. 美国的人口普查就是一个描述性分析的例子. 探索性分析(Exploratory) 在该分析类型中,我们试着去观察数据并发现之前未知的关系,因此这种分析有利于发现新的关联,同时也有助于确定今后的…
数据科学家人才危机现象,是FOMO还是Silver? 数据科学家的人才短缺和薪水高涨已经达到了顶板,未来还会持续下去吗? 在过去几年中,高级分析(#大数据#分析)空间一直经历着严重的FOMO(害怕错过).(译者住:FOMO(Fear of Missing Out)出自<人类行为计算>,意思为害怕错过朋友圈里发生的事情,在这里可以理解为,企业害怕错过大数据分析的浪潮.) 自从2012年<哈佛商业评论>发表了一篇声明数据科学家是本世纪最性感的工作,在2013年,麦肯锡全球研究院(MGI…
[王俊杰:阿里云MVP,陕西创博网络科技有限公司总经理.大数据与物联网的爱好者与实践者. 8年以上互联网从业经验,曾从事军工相关仿真分析软件研发与集成.4年以上大数据系统开发经验.目前正与天水市秦州区政府配合建设智慧安监.智慧环保.智慧党建.智慧妇联等智慧城市相关配套服务平台.] 2018年的9月18日,湖畔大学,阿里云MVP全球闭门会的现场.在会议开始之前,门前的公益项目认领台前人头攒动,来自西安的MVP王俊杰仔细地阅读公益项目的要求,最后他把自己的印章郑重地印在未来幼儿园公益项目上.之后的4…
用于建模的Python库 我们已经到达了本文最受期待的部分 - 构建模型!这就是我们大多数人首先进入数据科学领域的原因,不是吗? 让我们通过这三个Python库探索模型构建. Scikit-learn  就像用于数据操作的Pandas和用于可视化的matplotlib一样,scikit-learn是构建模型的Python库领导者.没有什么比得上它了. 事实上,scikit-learn建立在NumPy,SciPy和matplotlib之上.它是开源的,每个人都可以访问,并且可以在各种环境中重用.…
云原生时代,微服务如何演进? 原创 李响 阿里技术 2020-08-28   https://mp.weixin.qq.com/s/KQG2U8_aotDL4YFB8ee6Zw 一  微服务架构与云原生 微服务从 2010 年左右开始兴起.最开始大家会把微服务架构应用在传统 IT 的基础设施,也就是传统的 IDC 或者说物理机上,我们使用这些物理机为我们的微服务架构提供资源,形成一个分布式的系统,互相协作.协同. 随着我们整个的 IT 基础设施的发展,逐步到了云的时代. 我们在云时代做的第一步是…