Q-Q图主要可以用来回答这些问题: 两组数据是否来自同一分布 PS:当然也可以用KS检验,利用python中scipy.stats.ks_2samp函数可以获得差值KS statistic和P值从而实现判断. 两组数据的尺度范围是否一致 两组数据是否有类似的分布形状 前面两个问题可以用样本数据集在Q-Q图上的点与参考线的距离判断:而后者则是用点的拟合线的斜率判断. 用Q-Q图来分析分布的好处都有啥?(谁说对了就给他) 两组数据集的大小可以不同 可以回答上面的后两个问题,这是更深入的数据分布层面的…
最近在用python中的matplotlib画折线图,遇到了坐标轴 "数字+刻度" 混合显示.标题中文显示.批量处理等诸多问题.通过学习解决了,来记录下.如有错误或不足之处,望请指正. 一.最简单的基本框架如下:已知x,y,画出折线图并保存.此时x和y均为数字. # -*- coding: utf-8 -*- import matplotlib.pyplot as plt #引入matplotlib的pyplot子库,用于画简单的2D图 import random x= range(0…
案例说明: Python中的模块(.py文件)在创建之初会自动加载一些内建变量,__name__就是其中之一.Python模块中通常会定义很多变量和函数,这些变量和函数相当于模块中的一个功能,模块被导入到别的文件中,可以调用这些变量和函数.那么这时 name 的作用就彰显了,它可以标识模块的名字,可以显示一个模块的某功能是被自己执行还是被别的文件调用执行,假设模块A.B,模块A自己定义了功能C,模块B调用模块A,现在功能C被执行了: 如果C被A自己执行,也就是说模块执行了自己定义的功能,那么 n…
本文总结下Python中如何操作Neo4j数据库,用到py2neo包,Pip install 一下. 1 连接neo4j数据库:跟其它数据库一样,操作前必须输入用户名和密码及地址连接一下. from py2neo import Graph graph = Graph(") 2 清空数据库:删除图数据库里的一切点和边. graph.delete_all() 3 创建结点:label标记一簇结点,方便以后的结点查找操作,{}里是json字符串格式的属性对配置. temp_node = Node(la…
Python中的深浅拷贝 在讲深浅拷贝之前,我们先重温一下 is 和==的区别. 在判断对象是否相等比较的时候我们可以用is 和 == is:比较两个对象的引用是否相同,即 它们的id 是否一样 == : 比较两个对象的值是否相同. id() ,是Python的一个内置函数,返回对象的唯一标识,用于获取对象的内存地址. 如下 首先,会为整数1分配一个内存空间. 变量a 和 b 都指向了这个内存空间(内存地址相等),所以他们的id相等. 即 a is b 为 True 但是,真的所有整数数字都这样…
正则表达式应用的场景也非常多.常见的比如:搜索引擎的搜索.爬虫结果的匹配.文本数据的提取等等都会用到,所以掌握甚至精通正则表达式是一个硬性技能,非常必要. 正则表达式 正则表达式是一个特殊的字符序列,由普通字符和元字符组成.元字符能帮助你方便的检查一个字符串是否与某种模式匹配. Python中则提供了强大的正则表达式处理模块,即 re 模块, 为Python的内置模块. 下面,我带大家来一个入门demo例子,代码如下: import re reg_string = "hello9527pytho…
使用小括号的时候,还有很多特定用途的语法.下面列出了最常用的一些: 表4.常用分组语法 分类 代码/语法 说明 捕获 (exp) 匹配exp,并捕获文本到自动命名的组里 (?<name>exp) { python:  (?P<name>exp) } 匹配exp,并捕获文本到名称为name的组里,也可以写成(?'name'exp) (?:exp) 匹配exp,不捕获匹配的文本,也不给此分组分配组号 零宽断言 (?=exp) 匹配exp前面的位置 (?<=exp) 匹配exp后面…
成功的编程语言总是会成为顶级开发平台.对于 Python 和世界上的两个顶级编程环境 Java 和 Microsoft .NET 来说的确如此. 虽然人们因为 Python 能够快速组装不同的软件组件而常常称其为“粘合语言”,但已出现了对它的原生实现的需求.1997 年,麻省理工学院的研究生 Jim Hugunin 启动了 Jython 项目,即用 Java 实现 Python,该项目取得了非凡的成果,让我们可以在高效的 Java 虚拟机 (JVM) 上运行一种动态的高级语言.此后,Jython…
http://blog.csdn.net/pipisorry/article/details/38964135 LIBSVM是台湾大学林智仁(LinChih-Jen)教授等开发设计的一个简单.易于使用和快速有效的SVM模式识别与回归的软件包,他不但提供了编译好的可在Windows系列系统的执行文件,还提供了源代码,方便改进.修改以及在其它操作系统上应用:该软件对SVM所涉及的参数调节相对比较少,提供了很多的默认参数,利用这些默认参数可以解决很多问题:并提供了交互检验(Cross Validati…
互相关(cross-correlation)及其在Python中的实现 在这里我想探讨一下“互相关”中的一些概念.正如卷积有线性卷积(linear convolution)和循环卷积(circular convolution)之分:互相关也有线性互相关(linear cross-correlation)和循环互相关(circular cross-correlation).线性互相关和循环互相关的基本公式是一致的,不同之处在于如何处理边界数据.其本质的不同在于它们对原始数据的看法不同.通过这篇文章…