读书笔记一、pandas数据结构介绍
#直接传入一组数据
from pandas import Series,DataFrame
obj=Series([4,2,3])
obj
#Series的values和index属性获取数组表示形式和索引对象
obj.values
obj.index
#创建一个对各个数据点进行标记索引的Series
obj2=Series([4,2,3],index=['a','b','c'])
obj2
obj2.index
#通过索引的方式选取Series中的单个或者一组值
obj2['a']
obj2[['a','c','b']]
obj2['d']=6 #对数组进行运算保留索引和值之间的关系
obj2
obj2+obj2
obj2[obj2>2]
obj2*2 #将Series看成一个定长的有序字典,它是索引值到数据值的一个映射
'b' in obj2
'e' in obj2 #通过字典来创建Series
#只传入一个字典,则结果Series中的索引就是原字典中的键。
sdata={'Ohio':35000,'Texas':71000,'Oregon':16000,'Utah':5000}
obj3=Series(sdata)
obj3
states=['California','Ohio','Oregon','Texas']
obj4=Series(sdata,index=states)
obj4
sdata中和states索引相匹配的三个值会被找出来并放到相应的位置上,找不到“California"对应的sdata值,其结果就为NaN。在pandas中,NaN用于表示缺失或NA值。
#pandas的isnull函数、notnull函数用于检测缺失数据
pd.isnull(obj4)
pd.notnull(obj4) #Series也有类似的实例方法
obj4.isnull()
Series最重要的一个功能:在算术运算中会自动对齐不同索引的数据。(换句话说就是Series在进行算术运算时,index会自动对齐)
obj3
obj4
obj3+obj4 #会发现'California'和'Utah'索引对应的数据值是NaN #name属性
#Series本身以及其索引都有name属性
obj4.name='population'
obj4.index.name='state'
obj4 #通过赋值的方式就地修改Series的索引
obj.index=['Bob','Steve','Jeff']
obj
data={'state':['Ohino','Ohino','Ohino','Nevada','Nevada'],
'year':[2000,2001,2002,2001,2002],
'pop':[1.5,1.7,3.6,2.4,2.9]}
df=DataFrame(data)
df
#构造较为完整的DataFrame的参数:
DataFrame(data=None,index=None,columns=None)
#columns即“name”
如果指定了列序列,则DataFrame的列会按照指定顺序进行排列:
DataFrame(data,columns=['year','state','pop']) #如果传入的列找不到,就会产生NA值
df=DataFrame(data,index=['one','two','three','four','fiva'],
columns=['year','state','pop','debt'])
缺失值由NaN补上。
df.index
df.columns
type(df['debt'])
将DataFrame的列获取为一个Series
#两者等价
df['state']
df.state
df.ix['three']
列可以通过赋值的方式进行修改。
#对空列进行赋值
df['debt']=16.5
df['debt']=np.arange(5.)
将列表或数组进行赋值给某个列时,其长度必须跟DataFrame的长度相匹配。如果赋值的时一个Series,就会精确匹配DataFrame的索引,所有的空位都将被填上缺失值:
val=Series([-1.2,-1.5,-1.7],index=['two','four','fiva'])
df['debt']=val
df
为不存在的列赋值会创建出一个新列。关键字del用于删除列:
df['eastern']=df.state=='Ohino'
del df['eastern']
df.columns
另一种常见的数据形式是嵌套字典,将其传给DataFrame,被解释为:外层字典的键作为列,内层字典的键作为索引(也可以显示指定索引)
pop={'Nevada':{2001:2.4,2002:2.9},
'Ohio':{2000:1.5,2001:1.7,2002:3.6}}
frame=pd.DataFrame(pop)
#对frame进行转置,内层字典的键会被合并、排序以形成最终的索引
frame.T
#显示指定索引
DataFrame(pop,index=[2001,2002,2003]) #由Series组成的字典
pdata={'Ohio':frame3['Ohio'][:-1],
'Nevada':frame3['Nevada'][:2]} #设置DataFrame的index和columns的name属性,也会显示出来
frame3.index.name='year'
frame3.columns.name='state'
和Series一样,values属性也会以二维ndarray的形式分返回DataFrame中的数据:
frame3.values
读书笔记一、pandas数据结构介绍的更多相关文章
- [redis读书笔记] 第一部分 数据结构与对象 简单动态字符串
本读书笔记主要来自于<<redis设计与实现>> -- 黄键宏(huangz) redis主要设计了字符串,链表,字典,跳跃表,整数集合,压缩列表来做为基本的数据结构,实现键值 ...
- 深入探索Android热修复技术原理读书笔记 —— 热修复技术介绍
1.1 什么是热修复 对于广大的移动开发者而言,发版更新是最为寻常不过的事了.然而,如果你 发现刚发出去的包有紧急的BUG需要修复,那你就必须需要经过下面这样的流程: 这就是传统的更新流程,步骤十分繁 ...
- [REDIS 读书笔记]第一部分 数据结构与对象 跳跃表
下面是跳跃表的基本原理,REDIS的实现大致相同 跳跃表的一个特点是,插入NODE是通过随机的方式来决定level的,比较奇特 下面是skipList的一个介绍,转载来的,源地址:http://ken ...
- .Net中的AOP读书笔记系列之AOP介绍
返回<.Net中的AOP>系列学习总目录 本篇目录 AOP是什么? Hello,World! 小结 本系列的源码本人已托管于Coding上:点击查看,想要注册Coding的可以点击该连接注 ...
- [redis读书笔记] 第一部分 数据结构与对象 对象类型
- 从前面redis的基本数据结构来看,可以看出,redis都是在基本结构(string)的基础上,封装了一层统计的结构(SDS),这样让对基本结构的访问能够更快更准确,提高可控制度. - redis ...
- 读书笔记:《数据结构与算法分析Java语言描述》
目录 第 3 章 表.栈和队列 3.2 表 ADT 3.2.1 表的简单数组实现 3.2.2 简单链表 3.3 Java Collections API 中的表 3.3.1 Collection 接口 ...
- R语言实战读书笔记(一)R语言介绍
1.3.3 工作空间 getwd():显示当前工作目录 setwd():设置当前工作目录 ls():列出当前工作空间中的对象 rm():删除对象 1.3.4 输入与输出 source():执行脚本
- 深入理解linux网络技术内幕读书笔记(二)--关键数据结构
Table of Contents 1 套接字缓冲区: sk_buff结构 1.1 网络选项及内核结构 1.2 结构说明及操作函数 2 net_device结构 2.1 MTU 2.2 结构说明及操作 ...
- [redis读书笔记] 第一部分 数据结构与对象 对象特性
一 类型检查和多态 类型检查,即有的命令是只针对特定类型的,如果类型不对,就会报错,此处的类型,是指的键类型,即robj.type.下面为有类型检查的命令: 对于某一种类型,redis下底层的实 ...
随机推荐
- Rabbit MQ项目例子
地址链接: https://blog.csdn.net/cartoonmiao/article/details/51920766
- navicat的使用(测试库和正式库同步)以及用plsql改表字段属性
说明:数据库的操作,除了查询,最好先做好备份,比如数据同步.更新.修改或删除之类的: netstat -antp 查看mysql端口 firewall -cmd --list-all 查看防 ...
- Web上传文件的三种解决方案
第一点:Java代码实现文件上传 FormFile file = manform.getFile(); String newfileName = null; String newpathname = ...
- Cluster基础(一):配置iSCSI服务、编写udev规则、配置并访问NFS共享、部署Multipath多路径环境
一.配置iSCSI服务 目标: 本案例要求先搭建好一台iSCSI服务器,并将整个磁盘共享给客户端: 虚拟机添加新的磁盘 将新添加的磁盘分区并创建两个逻辑卷 逻辑卷名称分别为:/dev/myvg/isc ...
- C#中给RICHTEXTBOX加上背景图片
在系统自带的RichTextBox中是无法给它设置背景图片,但是我们在某些场合可能需要给RichTextBox设置背景图片.那么怎么实现这一想法呢?经过研究发现通过其它巧妙的途径可以给RichText ...
- 纯CSS实现项目展示遮罩详情效果
本实例主要用于项目展示时鼠标hover后显示一个遮罩显示项目详情的效果,遮罩采用CSS的绝对定位以及CSS3盒子模型. 本实例应用广泛,很多品牌官方网站均有采用. hover: <!DOCTYP ...
- BaseActivity 基类
public abstract class BaseActivity extends AppCompatActivity implements IBaseView { private ProxyAct ...
- ANTLR4 实验总结
问题总结: 1.不同类型编程语言之间转换的意义. 仅仅的字符替换?结构 2.编程语言转换的困难. 优先级:++运算符 不同语言有各自的优越性(Scala转C遇到困难) 编程思想冲突. 3.单纯应用在数 ...
- 移动端调试 — chrome模拟器基础调试
打开开发者工具,进入chrome调试状态,点击左上角的手机图标,进入手机模拟器调试状态. 模拟器支持操作: 切换设备类型,模拟网络环境,模拟bar,keyboard弹出状态,横屏状态,更改UserAg ...
- JS-DOM Event
DOM Level 0 Events:绑定到 DOM 的属性上,找不到官方文档 DOM0 是在 W3C 进行标准备化之前出现的,实际上是未形成标准的试验性质的初级阶段的 DOM. var tdiv = ...