这次准备做一下pandas在画图中的应用,要做数据分析的话这个更为实用,本次要用到的数据是pthon机器学习库sklearn中一组叫iris花的数据,里面组要有4个特征,分别是萼片长度.萼片宽度.花瓣长度.花瓣宽度,目标值是3种不同类型的花. 机器学习的时候在学习好这四个特征后就可以用来预测花的类型了,而图像化分析这些数据就是机器学习中很关键的步骤,接下来我们开始,先导入数据: import pandas as pd from sklearn import datasets from sklea…
KS检验统计量的扩展应用 KS(Kolmogorov-Smirnov)检验是比较两个经验分布之间是否存在差异. 我们设X1, X2,-, Xm, Y1, Y2,-, Ym为两个独立随机样本,分别满足假设A1和A2,分布函数分别为F, G.现在我们想知道的是X和Y的概率分布之间是否存在差异,我们建立以下假设 H0:F(t) = G(t), for every t H1:F(t) ≠ G(t), for at least one t 接下来我们要计算双边双样本统计量J 首先我们需要获得X,Y样本…