利用python数据分析panda学习笔记之基本功能

1 重新生成索引如果某个索引值不存在就引入缺失值

 from pandas import Series,DataFrame

 import pandas as pd

 import numpy as np

 obj=Series([4.5,7.2,-5.3,3.6],index=['d','b','a','c'])

 obj

 #重新生成索引

 obj2=obj.reindex(['a','b','c','d','e'])

 obj2

　　a使用method的ffill可以实现前向值填充，效果如下

 #前向填充

 obj3=Series(['blue','purple','yellow'],index=[,,])

 obj3.reindex(range(),method='ffill')

　　b:对于dataframe使用reindex可以同时修改行列索引，如果仅传入一个序列那么如下

 frame=DataFrame(np.arange().reshape((,)),index=['a','c','d'],

                 columns=['ohio','Texas','california'])

 frame

 frame2=frame.reindex(['a','b','c','d'])

 frame2

　　c：使用colunms重新索引列

 states=['Texax','Utah','california']

 frame.reindex(columns=states)

　　d:同时插入行列，但是插值只能按行应用

 #同时对行 列进行重新索引 而插值只能引用到行

 frame.reindex(index=['a','b','c','d'],method='ffill',

               columns=states)

reindex的参数说明如下：

2 丢弃制定轴上的项

　　a:drop方法返回一个指定轴上删除了指定值的新对象，删除列c

 #丢弃指定轴的项

 obj=Series(np.arange(.),index=['a','b','c','d','e'])

 new_obj=obj.drop('c')

 new_obj

　　b：删除两个 b c

obj.drop(['d','c'])

　　c：对于dataframe可以删除任意轴上的索引

 #对于DataFrame可以删除任意轴的索引

 data = DataFrame(np.arange().reshape((,)),

                  index=['ohio','colorado','utah','new york'],

                    columns=['one','two','three','four'])

 #删除两个

 data.drop(['colorado','ohio'])

3 索引，选取和过滤

　　a:Series中的索引类似与Numpy，但是不只是整数，索引字符

 obj=Series(np.arange(.),index=['a','b','c','d'])

 obj['b']#1.0

　　b：按照整数，范围

 obj[]#1.0

 obj[:]#

　　c：利用标签的切片运算和普通depython切片不同，其包含末端

 obj['b':'c']#b c

　　d：那么对dataframe进行索引就是获取一个或者多个列勒

 data=DataFrame(np.arange().reshape(,),

            index=['ohio','colorado','mike','jason'],

                  columns=['one','two','three','four'])

 data

　　e：选择一列

data['two']#输出第二列+行号 也就是索引

　　f：选择多列

 data[['three','one']]

　　g：选取行标签前两行

data[:]#选取的是前面两行

　　h：选取第三列大于5的值

data[data['three']>]

　　i：为了能在dataframe的行上进行标签索引引入字段ix

data.ix['colorado',['two','three']]

　　j：选取第4 1 2列而且行为colorado jason

data.ix[['colorado','jason'],[,,]]

　　k：输出行mike

data.ix[]

DataFrame索引总结

4 算数运算和数据对齐

　　a:Series的加法

 s1=Series([7.3,-2.5,3.4,1.5],index=['a','c','d','e'])

 s2=Series([-2.1,3.6,-1.5,,3.1],index=['a','c','e','f','g'])
3 s1+s2

　　b:对于dataframe，对齐会同时发生在行列中

df1=DataFrame(np.arange(.).reshape((,)),columns=list('bcd'),

              index=['utah','ohio','colorado'])

df2=DataFrame(np.arange(.).reshape((,)),columns=list('bde'),

              index=['utah','ohio','colorado','oragen'])

df1+df2

------>索引和列都为其并集

　　c：在算术方法中填充值。比如说两个dataframe相加，其中一个不在的时候填充为0

 #算术中进行填充

 df1=DataFrame(np.arange(.).reshape((,)),columns=list('abcd'))

 df2=DataFrame(np.arange(.).reshape((,)),columns=list('abcde'))

 df1+df2

#使用df1的add方法 传入df2以及一个fill_value参数

df1.add(df2,fill_value=)

5 DataFrame和Series之间的运算----->广播，也就是如果第一个数值-1，那么这个列都会减1

　　a：看一看一个二维数组和一行之间的差

arr=np.arange(.).reshape((,))

arr[]

arr-arr[]

　　b:frame和series的运算

frame=DataFrame(np.arange(.).reshape((,)),columns=list('bde'),

                index=['utah','ohio','texas','orogen'])

series=frame.ix[]

frame-series

好了，加油骚年！！！！

利用python数据分析panda学习笔记之基本功能的更多相关文章

利用python数据分析panda学习笔记之Series
1 Series a:类似一维数组的对象,每一个数据与之相关的数据标签组成 b:生成的左边为索引,不指定则默认从0开始. from pandas import Series,DataFrame imp ...
利用python数据分析panda学习笔记之DataFrame
2 DataFrame a:通过传入一个等长的列表构成DataFrame 自动加上索引 data={'state':['ohio','ohio','ohio','Nevada','Nevada'], ...
python数据分析入门学习笔记
学习利用python进行数据分析的笔记&下星期二内部交流会要讲的内容,一并分享给大家.博主粗心大意,有什么不对的地方欢迎指正~还有许多尚待完善的地方,待我一边学习一边完善~ 前言:各种和数据分 ...
python数据分析入门学习笔记儿
学习利用python进行数据分析的笔记儿&下星期二内部交流会要讲的内容,一并分享给大家.博主粗心大意,有什么不对的地方欢迎指正~还有许多尚待完善的地方,待我一边学习一边完善~ 前言:各种和数据 ...
Python数据分析:Numpy学习笔记
Numpy学习笔记 ndarray多维数组创建 import numpy as np np.array([1,2,3,4]) np.array([1,2,3,4,],[5,6,7,8]) np.ze ...
$《利用Python进行数据分析》学习笔记系列——IPython
本文主要介绍IPython这样一个交互工具的基本用法. 1. 简介 IPython是<利用Python进行数据分析>一书中主要用到的Python开发环境,简单来说是对原生python交互环 ...
Requests:Python HTTP Module学习笔记（一）（转）
Requests:Python HTTP Module学习笔记(一) 在学习用python写爬虫的时候用到了Requests这个Http网络库,这个库简单好用并且功能强大,完全可以代替python的标 ...
python网络爬虫学习笔记
python网络爬虫学习笔记 By 钟桓 9月 4 2014 更新日期:9月 4 2014 文章文件夹 1. 介绍: 2. 从简单语句中開始: 3. 传送数据给server 4. HTTP头-描写叙述 ...
Python Built-in Function 学习笔记
Python Built-in Function 学习笔记 1. 匿名函数 1.1 什么是匿名函数 python允许使用lambda来创建一个匿名函数,匿名是因为他不需要以标准的方式来声明,比如def ...

随机推荐

man gitworkflows
gitworkflows(7) Manual Page NAME gitworkflows - An overview of recommended workflows with Git SYNOPS ...
win7-64bit下基于VMware12.5安装rhel-server-6.3-i386
/************************************************************************************* 宿主PC:win7-64b ...
oracle sql 当初始化数据时避免重复主键
一:当有主键序列自动增长时候(序列为:seq_cct_id) insert into cs_cost_type (CCT_ID, CCT_NAME, CCT_RATE, CCT_RATE_TYPE, ...
一堂C++课玩转rpm包的制作
常见的Linux发行版主要可以分为两类,类ReadHat系列和类Debian系列,这里我们是以其软件包的格式来划分的,这两类系统分别提供了自己的软件包管理系统和相应的工具.类RedHat系统中软件包的 ...
基于live555实现的跨平台高性能RTSPServer流媒体服务器EasyIPCamera
本文转自EasyDarwin团队成员kim的博客:http://blog.csdn.net/jinlong0603/article/details/52366412 简介 EasyIPCamera是由 ...
windows与mac共享文件
实际操作环境是win10实体机与mac10.10虚拟机共享文件. 需要两步操作: 在win10中设置一个共享文件夹: 在mac中点击Finder——窗口左侧的列表——共享的——共享屏幕——输入用户名密 ...
eclipse 中PlantUML的安装和使用
安装: 填写的地址:http://hallvard.github.io/plantuml/ 安装完plantUML后,还要下载一个Graphviz https://pan.baidu.com/s/1g ...
vue程序中组件间的传值方式
vue程序在组件中进行传值有多种方式,这里记录我在项目中使用到的三种: 1. 父组件向子组件传值 2. 子组件向父组件传值 3. 通过路由传参父组件通过props向子组件传值在子组件script中 ...
div遮罩弹框口
<html> <head> <meta http-equiv="Content-Type" content="text/html; char ...
hdu-5742 It's All In The Mind(数学)
题目链接: It's All In The Mind Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/65536 K (J ...

利用python数据分析panda学习笔记之基本功能

利用python数据分析panda学习笔记之基本功能的更多相关文章

随机推荐

热门专题