本文转自知乎 作者:苏格兰折耳喵 ----------------------------------------------------- 在本文中,作者引出了"外部数据"这一概念,并实例分析,如何从海量的外部数据中获取可以对自身业务起到指导作用和借鉴意义的insight,并借助外部环境数据来优化自己. 现在互联网上关于"增长黑客"的概念很火,它那"四两拨千斤"."小投入大收益"的神奇法力令无数互联网从业者为之着迷.一般来说…
本文转自知乎 作者:苏格兰折耳喵 ----------------------------------------------------- 对于当下共享单车在互联网界的火热状况,笔者想从大数据文本挖掘的角度来做一番分析,主要是从海量的文本数据中找到有价值的讯息和观察视角,透过文本挖掘了解共享单车相关的热门话题和潜在趋势. Note:本文写于2017.07,那个时候,共享单车界算是"那时花开月正圆",局势还凑合. 2016年底以来,国内共享单车毫无征兆的就火爆了起来,彼时一张手机截屏蹿…
本文转自知乎 作者:苏格兰折耳喵 ----------------------------------------------------- 作为数据分析爱好者,本文作者将想从数据的角度去解读<欢乐颂2>这部热播剧的方方面面,包括舆情传播.网络口碑.人物社交网络分析及,以及小说内容的文本分析. 5月11日,让众多安迪粉期待已久的<欢乐颂>第二季终于播出.相比首季,<欢乐颂2>在造型和场景上显得更为精致时尚,且其中每个角色的造型却都是遵从的其身份和背景,并不突兀. 正所谓…
本文转自知乎 作者:苏格兰折耳喵 ----------------------------------------------------- 当我们想要创业却对市场行情不甚了解,该如何迅速了解市场行情,以便我们能更好的切入市场?本文作者介绍了一种零成本用大数据获悉市场行情的方法,对你想要了解市场行情非常有帮助. 最近一个朋友想创业,做母婴方面的项目,之前没做过该类项目,有了几个备选项目,分别是产后恢复.婴儿游泳.月子餐和月子会所,这些他都觉得不错,所以就有点选择恐惧症,想知道做哪个case有搞头…
摘要:分享一个HBase集群恢复的方法. 背景 在HBase 1.x中,经常会遇到元数据不一致的情况,这个时候使用HBCK的命令,可以快速修复元数据,让集群恢复正常. 另外HBase数据迁移时,大家经常使用到一种迁移方式是:拷贝HBase的数据目录/hbase/data/default到新的集群,然后在新集群执行HBCK的命令让元数据重建,这种拷贝数据目录然后恢复元数据的方式是一种快速直接的手段. HBase升级到2.X版本之后,hbase hbck中的一些修复命令已经不再支持,包括,所以在HB…
哲学告诉我们:世界是一个普遍联系的有机整体,现象之间客观上存在着某种有机联系,一种现象的发展变化,必然受与之关联的其他现象发展变化的制约与影响,在统计学中,这种依存关系可以分为相关关系和回归函数关系两大类,本次分享,jacky将跟您分享如何用python做相关关系,并以真实金融案例为依托,深入浅出,探讨相关分析在实际工作中应用. 基础铺垫 相关系数(correlation coefficient) 相关系数是变量间关联程度的最基本测度之一,如果我们想知道两个变量之间的相关性,那么我们就可以计算相…
本文转自知乎 作者:苏格兰折耳喵 ----------------------------------------------------- 在本文中,笔者将会介绍大数据分析主要的处对象---社会化媒体(Social Media),以及对社会化媒体进行分析的重要手段--社会化聆听(Social Listening).最后,笔者将以汽车行业的一个实操案例,来讲述如何使用社会化聆听(工具)来对社会化媒体大数据进行分析. 0 楔子 "大数据"一直是最近几年全球很火的概念.搜索关键词"…
作为.Net工地搬砖长工一名,一直致力于挖坑(Bug)填坑(Debug),但技术却不见长进.也曾热情于新技术的学习,憧憬过成为技术大拿.从前端到后端,从bootstrap到javascript,从python到Node.js,了解过设计模式,也跟风了微信公众号开发.然而却浅尝辄止,未曾深入.买了一本本的技术书籍,没完整的翻完一本.屯了一部部的pdf,却只是在手机里占着内存.想过改变,却从未曾着手改变. 以上算是我程序猿生涯的真实写照. 现在我要尝试改变,从基础的helloworld开始,记下学习…
申明:本文是基于python3.x及selenium3.x. unittest,也可以称为PyUnit,可以用来创建全面的测试套件,可以用于单元自动化测试(模块).功能自动化测试(UI)等等. 官方文档:https://docs.python.org/3.6/library/unittest.html unittest具备创建测试用例.测试套件.测试夹具的能力,包括的组件如下: Test Fixture(测试夹具):通过使用测试夹具,可以定义在单个或者多个测试执行之前的准备工作和测试执行后的清理…
类级别的setUp()方法与tearDown()方法 在实操(一)的例子中,通过setUp()方法为每个测试方法都创建了一个Chrome实例,并且在每个测试方法执行结束后要关闭实例.是不是觉得有个多余了!能否让各个测试方法共用一个Chrome实例,而不用每次都创建一个新的实例呢?肯定可以的,unittest为我们提供了明路.可以通过用setUpClass()方法和tearDownClass()方法及@classmethod标识来实现.这两个方法使我们可以在类级别来初始化数据,替代了方法级别的初始…