001_python实现数据分析

一、

# coding:utf8

# !/usr/bin/python

# import numpy as np

import pandas as pd

import np

def example2():

    '''

    Describing a numeric ``Series``.

    :return:

    '''

    s = pd.Series([1, 2, 3])

    print s.describe()

    '''

    count    3.0

    mean     2.0

    std      1.0

    min      1.0

    25%      1.5

    50%      2.0

    75%      2.5

    max      3.0

    dtype: float64

    '''

def example3():

    '''

    Describing a categorical ``Series``.

    :return:

    '''

    s = pd.Series(['a', 'a', 'b', 'c'])

    print s.describe()

    '''

    count     4

    unique    3

    top       a

    freq      2

    dtype: object

    '''

def example4():

    '''

    Describing a timestamp ``Series``.

    :return:

    '''

    s = pd.Series([

        np.datetime64("2000-01-01"),

        np.datetime64("2010-01-01"),

        np.datetime64("2010-01-01")

        ])

    print s.describe()

    '''

    count                       3

    unique                      2

    top       2010-01-01 00:00:00

    freq                        2

    first     2000-01-01 00:00:00

    last      2010-01-01 00:00:00

    dtype: object

    '''

def example5():

    '''

    Describing a ``DataFrame``. By default only numeric fields are returned.

    :return:

    '''

    df = pd.DataFrame({'categorical': pd.Categorical(['d', 'e', 'f']),

                       'numeric': [1, 2, 3],

                        'object': ['a', 'b', 'c']})

    print df.describe()

    '''

    #Describing all columns of a ``DataFrame`` regardless of data type.

    print df.describe(include='all')

    #Describing a column from a ``DataFrame`` by accessing it as an attribute.

    print df.numeric.describe()

    #Including only numeric columns in a ``DataFrame`` description.

    print df.describe(include=[np.number])

    #Including only string columns in a ``DataFrame`` description.

    print df.describe(include=[np.object])

    #Including only categorical columns from a ``DataFrame`` description.

    print df.describe(include=['category'])

    #Excluding numeric columns from a ``DataFrame`` description.

    print df.describe(exclude=[np.number])

    #Excluding object columns from a ``DataFrame`` description.

    print df.describe(exclude=[np.object])

    '''

def example1():

    dic1={'000':{'a':1,'b':2,'c':3},'001':{'d':4,'e':5,'f':6}}

    df2=pd.DataFrame(dic1)

    # print df2.describe()

    '''

           000  001

    count  3.0  3.0

    mean   2.0  5.0

    std    1.0  1.0

    min    1.0  4.0

    25%    1.5  4.5

    50%    2.0  5.0

    75%    2.5  5.5

    max    3.0  6.0

    '''

    print "返回非NAN数据项数量=>count()\n{count}\n".format(count = df2.describe().count())

    print "返回中位数,等价第50位百分位数的值=>median()\n{median}\n".format(median = df2.describe().median())

    print "返回数据的众值=>mode()\n{mode}\n".format(mode = df2.describe().mode())

    print "返回数据的标准差(描述离散度)=>std()\n{std}\n".format(std = df2.describe().std())

    print "返回方差=>var()\n{var}\n".format(var = df2.describe().var())

    print "偏态系数(skewness,表示数据分布的对称程度)=>skew()\n{skew}\n".format(skew = df2.describe().skew())

def main():

    example1()

if __name__ == '__main__':

    main()

输出=>

返回非NAN数据项数量=>count()

000    8

001    8

dtype: int64

返回中位数,等价第50位百分位数的值=>median()

000    2.00

001    4.75

dtype: float64

返回数据的众值=>mode()

   000  001

0  1.0  5.0

1  2.0  NaN

2  3.0  NaN

返回数据的标准差(描述离散度)=>std()

000    0.801784

001    1.603567

dtype: float64

返回方差=>var()

000    0.642857

001    2.571429

dtype: float64

偏态系数(skewness,表示数据分布的对称程度)=>skew()

000    0.000000

001   -1.299187

dtype: float64

001_python实现数据分析的更多相关文章

利用Python进行数据分析基础系列随笔汇总
一共 15 篇随笔,主要是为了记录数据分析过程中的一些小 demo,分享给其他需要的网友,更为了方便以后自己查看,15 篇随笔,每篇内容基本都是以一句说明加一段代码的方式, 保持简单小巧,看起来也清晰 ...
利用Python进行数据分析(10) pandas基础: 处理缺失数据
数据不完整在数据分析的过程中很常见. pandas使用浮点值NaN表示浮点和非浮点数组里的缺失数据. pandas使用isnull()和notnull()函数来判断缺失情况. 对于缺失数据一般处理 ...
利用Python进行数据分析(12) pandas基础: 数据合并
pandas 提供了三种主要方法可以对数据进行合并: pandas.merge()方法:数据库风格的合并: pandas.concat()方法:轴向连接,即沿着一条轴将多个对象堆叠到一起: 实例方法c ...
利用Python进行数据分析(5) NumPy基础: ndarray索引和切片
概念理解索引即通过一个无符号整数值获取数组里的值. 切片即对数组里某个片段的描述. 一维数组一维数组的索引一维数组的索引和Python列表的功能类似: 一维数组的切片一维数组的切片语法格式为a ...
利用Python进行数据分析(9) pandas基础: 汇总统计和计算
pandas 对象拥有一些常用的数学和统计方法. 例如,sum() 方法,进行列小计: sum() 方法传入 axis=1 指定为横向汇总,即行小计: idxmax() 获取最大值对应的索 ...
利用Python进行数据分析(8) pandas基础: Series和DataFrame的基本操作
一.reindex() 方法:重新索引针对 Series 重新索引指的是根据index参数重新进行排序. 如果传入的索引值在数据里不存在,则不会报错,而是添加缺失值的新行. 不想用缺失值,可以用 ...
利用Python进行数据分析(7) pandas基础: Series和DataFrame的简单介绍
一.pandas 是什么 pandas 是基于 NumPy 的一个 Python 数据分析包,主要目的是为了数据分析.它提供了大量高级的数据结构和对数据处理的方法. pandas 有两个主要的数据结构 ...
利用Python进行数据分析(4) NumPy基础: ndarray简单介绍
一.NumPy 是什么 NumPy 是 Python 科学计算的基础包,它专为进行严格的数字处理而产生.在之前的随笔里已有更加详细的介绍,这里不再赘述. 利用 Python 进行数据分析(一)简单介绍 ...
利用Python进行数据分析(3) 使用IPython提高开发效率
一.IPython 简介 IPython 是一个交互式的 Python 解释器,而且它更加高效. 它和大多传统工作模式(编辑 -> 编译 -> 运行)不同的是, 它采用的工作模式是:执 ...

随机推荐

【Teradata】TD Unicode编码格式下varchar定义测试
如下测试表,每个字段字符编码格式均为Unicode. 1.varchar(1)可以存储1个汉字,也只能存储1个ASCII字符. --创建表nc_test,每个字段编码格式均设定为Unicode[使用S ...
Abp通用配置模块的设计
引言约定优于配置,配置趋于灵活约定优于配置(convention over configuration),也称作按约定编程,是一种软件设计范式,旨在减少软件开发人员需做决定的数量,获得简单的好处, ...
使用 Node.js 搭建 Web 服务器
使用Node.js搭建Web服务器是学习Node.js比较全面的入门教程,因为实现Web服务器需要用到几个比较重要的模块:http模块.文件系统.url解析模块.路径解析模块.以及301重定向技术等, ...
Unity的Mesh压缩：为什么我的内存没有变化？
0x00 前言最近和朋友聊天,谈到了Mesh的内存优化问题,他发现开启Model Importer面板上的Mesh Compression选项之后,内存并没有什么变化.事实上,期望开启Mesh Co ...
vue2.0 配置环境总结（都是泪啊）
最近有点空闲时间,终于把一直想学的vue提上了日程,以下是收集的一些帮助入门的链接 1:https://vuefe.cn/v2/guide/ vue2.0中文官网 2:https://router.v ...
Python面向对象组合（选课系统示例）
# Author : Kelvin # Date : 2019/1/15 20:44 """ 学校与老师关联课程与老师和学校关联 """ ...
【Android Studio安装部署系列】二十七、Android studio修改项目名称和包名
版权声明:本文为HaiyuKing原创文章,转载请注明出处! 概述实际项目开发中可能碰到项目名称写错了或者需要修改,而且包名可能也想要修改,那么如何操作呢. 本文是在Android Studio3. ...
完美解决phpstudy安装后mysql无法启动（无需删除原数据库，无需更改任何配置，无需更改端口）直接共存
PHPstudy与原Mysql兼容解决一.前言今天学习php,当然是要先安装好运行环境了,phpstyudy是一个运行php的集成环境, 一键安装对新手很友好,与时作为一个新手,便跟着教程安装了p ...
Vue Mixin 与微信小程序 Mixins 应用
什么是Mixin(混入) Mixin是一种思想,用来实现代码高度可复用性,可以针对属性复制实现代码复用的想法进行一个扩展,就是混入(mixin).混入并不是复制一个完整的对象,而是从多个对象中复制出任 ...
js或jquery实现点击某个按钮或元素显示div,点击页面其他任何地方隐藏div
点击某个元素显示div,点击页面其他任何地方隐藏div,可用javascript和jquery两种方法实现: 一:javascript实现方法技巧<script>//定义stopPropa ...

001_python实现数据分析

001_python实现数据分析的更多相关文章

随机推荐

热门专题