方法1     统计逻辑:统计一个loginname的所有去重的通讯录数C,统计这个Loginname对应的每个设备对应的通讯录c1,c2,c3…cn; X=(c1/c+c2/c+c3/c+….cn/c)/n=(c1+c2+…cn)/(c*n) 数据表现如下: 将3个以上设备计算出来的结果关联上黑名单库,在8092个loginname中,有3915个, 占48.4%.将是否黑名单当作Y值,X值为自变量进行回归: Y与X之间的相关性为0.1229,显著性正相关. 回归统计 Multiple R 0…
之前听朋友吐槽过,他们是上千人的企业,但做数据分析居然还是靠手动上传数据,而且还是用的excel做的.但其实excel并不是企业做数据分析的好工具. 数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程.这一过程也是质量管理体系的支持过程. 在实际工作中,数据分析可帮助企业作出判断,以便采取适当行动.我们先来看看企业数据分析的过程:       既然说到Excel做数据分析,那就先看看excel是如何分析数据的 一般接触信息化和数…
"Excel在过去.现在和未来都是一个无比优秀和天才的工具,无数虔诚的信徒将其奉为唯一的法门,而我却并不在其中了." 作为一个数据分析师,Excel是我入门必备的数据分析工具,虽然上手快,但也给我带了诸多不便,各种复杂问题. 一旦超过10万的数据量.或者函数.逻辑复杂一些,Excel绝对能卡到怀疑人生:想要实现数据的分析和清洗,不得不依靠各种函数和VBA,繁琐程度不亚于任何一门编程语言:业务流转过程中根本没办法保证数据的原貌,拿到手的Excel表不知道修改了多少次....... 相信我…
使用R做回归分析整体上是比较常规的一类数据分析内容,下面我们具体的了解用R语言做回归分析的过程. 首先,我们先构造一个分析的数据集 x<-data.frame(y=c(102,115,124,135,148,156,162,176,183,195), var1=runif(10,min=1,max=50), var2=runif(10,min=100,max=200), var3=c(235,321,412,511,654,745,821,932,1020,1123)) 接下来,我们进行简单的一…
一.简介 这次学习的书籍主要是Hands-on Machine Learning with Scikit-Learn and TensorFlow(豆瓣:https://book.douban.com/subject/26840215/), 这本偏向实战,阅读前需要对机器学习和python有一定的认知. 二.安装Jupyter 本书代码主要都是在Jupyter上运行,安装方法也很简单,直接在shell上输入pip3 install --upgrade juyter安装(需事先安装pip),再输入…
来到大数据分析的时代,大量的大数据分析软件涌现,尽管如此,如果今天有人问起最常用的数据透视分析工具是什么的时候,我猜想Excel应该是大家的不二之选. 但是其实我想说,用现在的手机来打比方,Excel就好比老人机,当大家都在用新一代的"智能手机"--思迈特软件Smartbi的时候,你还在用老人机,这样一对比,简直就是在被当街吊打. 为什么说Excel就好比老人机呢? 1.Excel数据分析处理能力较低,几十万条的数据转半天都转不出来. 2.Excel入门容易但是想要精通却很难,一旦想要…
Excel 是个很有趣的工具,不管你是不是数据分析领域的打工人,都一定听过它的名字,甚至在全球拥有大量虔诚的粉丝.Excel这个名字其实源自英语中的" Excellence "一词,代表着:卓越和优秀.可以说,从诞生之初就被寄予了很高的期望. Excel 不负众望,成为了数据分析人必备的神器. Excel拥有不少数据分析的优势: 1)Excel拥有400多个内置的函数公式,直接套用很便利: 2)通过Excel可以制作出丰富多样的图表形式: 3)使用宏功能减少重复操作: 更夸张的是,各路…
数据驱动部分,是自动化测试常用部分,也是参数化设计的重要环节,前面分享了,mysql.yaml做数据源,那么再来分享下excel做数据驱动 思路: 先用POI读取excel.解析读取数据,返回list,返回Object[][]即可 工具类文件: 读取excel,返回map对象list集合 ReadExcelUtil.java import org.apache.poi.hssf.usermodel.HSSFWorkbook; import org.apache.poi.ss.usermodel.…
转载来自:http://yufan-fansbook.blogspot.tw/2013/09/excel-fft-fast-fourier-transform02.html [Excel]-用EXCEL做快速傅立葉轉換_FFT in Excel(Fast Fourier Transform in Excel)_02   [Excel]-用EXCEL做快速傅立葉轉換_FFT in Excel(Fast Fourier Transform in Excel)_02 第二步:建立想要做快速傅立葉分析的…
1) 用 numpy读入csv文件是报错 UnicodeDecodeError: 'gbk' codec can't decode byte 0xbf in position 2: illegal multibyte sequence loadtxt 写法没有问题: 主要是csv文件的存储有问题: import numpy as np A = np.loadtxt("A.csv",dtype = np.int , delimiter = ",") 主要是csv文件的…