一、Pandas

　　pandas的数据元素包括以下几种类型：

类型	说明
object	字符串或混合类型
int	整型
float	浮点型
datetime	时间类型
bool	布尔型

二、Series与DataFrame区别：

Series是带索引的一维数组
Series对象的两个重要属性是：index（索引）和value（数据值）
DataFrame的任意一行或者一列就是一个Series对象

三、创建Series对象：pd.Series(data,index=index)

　　其中data可以是很多类型：

1. 一个列表---------->pd.Series([1,2,3])
2. 一个ndarray------->pd.Series(np.random.randint(2),index=['a','b'])
3. 一个python字典---->pd.Series({"a":2,"b":0})
4. 一个标量值-------->pd.Series(3,index=[1,2,3])

　　Series在算数运算中会自动对齐不同索引的数据：

　　　　例如：

 >>> s=pd.Series([1,2,3],index=['a','b','c'])

 >>> a=pd.Series([4,1,0],index=['b','a','c'])

 >>> s+a

 a    2

 b    6

 c    3

　　　　　　unique():返回结果是一个数组，包含Series去重后的元素

　　　　　　value_counts():查看每一个唯一元素的频数

四、创建DataFrame对象：pd.DataFrame(data,index,columns)

　　与Series不同的是，DataFrame包括索引index和表头columns：

　　其中data可以是很多类型：

1. 包含列表、字典或者Series的字典
2. 二维数组
3. 一个Series对象
4. 另一个DataFrame对象

　　　例如：

　　　1、从字典创建：

 >>> d = {'one':pd.Series([1,2,3],index=['a','b','c']), 'two':pd.Series([2,3,4],index=['a','b','d'])}

 >>> pd.DataFrame(d)

 　 one  two

 a  1.0  2.0

 b  2.0  3.0

 c  3.0  NaN

 d  NaN  4.0

　　　2、从字典创建

 >>> pd.DataFrame(d,index=['a','b'],columns=['w1','w2'])

     w1   w2

 a  NaN  NaN

 b  NaN  NaN

 >>> pd.DataFrame(d,index=['a','b'],columns=['one','two'])

    one  two

 a    1    2

 b    2    3

五、DataFrame的数据筛选

　　与Series类似，可通过布尔表达式按照一定条件进行筛选。不同于Series的是，DataFrame布尔筛选返回的是满足筛选条件的样本的所有列的数据（即：一返回就是一条记录）。

　　上例子！

 >>> d = {'one':pd.Series([1,2,3],index=['a','b','c']),'two':pd.Series([2,3,4],index=['a','b','d'])}

 >>> pd.DataFrame(d)

 >>> d[d['one']<3]

    one  two

 a  1.0  2.0

 b  2.0  3.0

六、DataFrame的删除和添加一列

　　添加一列：（1）像字典一样通过赋值的方式执行

 >>> d['three']=d['one']+d['two']

　　　　　　　（2）使用insert()在指定位置插入一列，例如在位置1插入新的一列'new',值为0

>>> d.insert(1,'new',np.zeros((4,1)))

>>> d

one  new  two  three

  a  1.0  0.0  2.0    3.0

  b  2.0  0.0  3.0    5.0

  c  3.0  0.0  NaN    NaN

  d  NaN  0.0  4.0    NaN

　　删除一列：像字典一样------>使用pop()或者del()，pop()可以在删除列的基础之上将删除的列赋值给一个新的变量

 >>> del d['three']

 >>> d

    one  new  two

 a  1.0  0.0  2.0

 b  2.0  0.0  3.0

 c  3.0  0.0  NaN

 d  NaN  0.0  4.0

 >>> new = d.pop('new')

 >>> d

    one  two

 a  1.0  2.0

 b  2.0  3.0

 c  3.0  NaN

 d  NaN  4.0

 >>> new

 a    0.0

 b    0.0

 c    0.0

 d    0.0

 Name: new, dtype: float64

六、DataFrame修改索引名：使用rename()方法

 >>> d

    one  two

 a  1.0  2.0

 b  2.0  3.0

 c  3.0  NaN

 d  NaN  4.0

 >>> i = {'a':'A','b':'B'}

 >>> d.rename(index=i)

    one  two

 A  1.0  2.0

 B  2.0  3.0

 c  3.0  NaN

 d  NaN  4.0

3-Pandas之Series和DataFrame区别的更多相关文章

利用Python进行数据分析(7) pandas基础: Series和DataFrame的简单介绍
一.pandas 是什么 pandas 是基于 NumPy 的一个 Python 数据分析包,主要目的是为了数据分析.它提供了大量高级的数据结构和对数据处理的方法. pandas 有两个主要的数据结构 ...
Python之Pandas中Series、DataFrame
Python之Pandas中Series.DataFrame实践 1. pandas的数据结构Series 1.1 Series是一种类似于一维数组的对象,它由一组数据(各种NumPy数据类型)以及一 ...
Python之Pandas中Series、DataFrame实践
Python之Pandas中Series.DataFrame实践 1. pandas的数据结构Series 1.1 Series是一种类似于一维数组的对象,它由一组数据(各种NumPy数据类型)以及一 ...
Pandas中Series和DataFrame的索引
在对Series对象和DataFrame对象进行索引的时候要明确这么一个概念:是使用下标进行索引,还是使用关键字进行索引.比如list进行索引的时候使用的是下标,而dict索引的时候使用的是关键字. ...
利用Python进行数据分析(8) pandas基础: Series和DataFrame的基本操作
一.reindex() 方法:重新索引针对 Series 重新索引指的是根据index参数重新进行排序. 如果传入的索引值在数据里不存在,则不会报错,而是添加缺失值的新行. 不想用缺失值,可以用 ...
pandas基础: Series和DataFrame的简单介绍
一.pandas 是什么 pandas 是基于 NumPy 的一个 Python 数据分析包,主要目的是为了数据分析.它提供了大量高级的数据结构和对数据处理的方法. pandas 有两个主要的数据结构 ...
pandas学习series和dataframe基础
PANDAS 的使用一.什么是pandas? 1.python Data Analysis Library 或pandas 是基于numpy的一种工具,该工具是为了解决数据分析人物而创建的. 2.p ...
[Python] Pandas 中 Series 和 DataFrame 的用法笔记
目录 1. Series对象自定义元素的行标签使用Series对象定义基于字典创建数据结构 2. DataFrame对象自定义行标签和列标签使用DataFrame对象可以基于字典创建数据结构 ...
pandas中series和dataframe之间的区别
series结构有索引,和列名组成,如果没有,那么程序会自动赋名为None series的索引名具有唯一性,索引可以数字和字符,系统会自动将他们转化为一个类型object. dataframe由索引和 ...

随机推荐

HTTPS协议详解(三)：PKI 体系
转自:https://blog.csdn.net/hherima/article/details/52469488 1.RSA身份验证的隐患身份验证和密钥协商是TLS的基础功能,要求的前提是合 ...
[Mybatis]Mybatis常用操作
Mybatis是目前国内比较流行的ORM框架,特点是可以写灵活的SQL语句,非常适合中小企业的面向数据库开发. 本文总结自己开发过程中常用的Mybatis操作. 一.插入操作主键自增插入单条 < ...
Jmeter系列（41）- Jmeter + Ant +Jenkins 持续集成
如果你想从头学习Jmeter,可以看看这个系列的文章哦 https://www.cnblogs.com/poloyy/category/1746599.html Window 环境准备安装 ant: ...
day80 前端项目
目录一.初始化项目二.安装路由vue-router 1 配置路由 1.1 初始化路由对象 1.2 注册路由信息 1.3 在视图中显示路由对应的内容 2 路由对象提供的操作 2.1 页面跳转 2.2 ...
day18 装饰器（下）+迭代器+生成器
目录一.有参装饰器 1 前提 2 如何使用有参装饰器 3 有参装饰器模板 4 修正装饰器二.迭代器 1 什么是迭代器 2 为什么要有迭代器 3 如何用迭代器 3.1 可迭代对象 3.2 可迭代对象 ...
mui div滚动阻止触发下拉刷新
function orderListScroll () { var _orderObj = document.querySelector('.circulation-loan-list') //div ...
CSS 的层叠上下文是什么
层叠上下文是 HTML 中的一个三维的概念,每个层叠上下文中都有一套元素的层叠排列顺序.页面根元素天生具有层叠上下文,所以整个页面处于一个“层叠结界”中. 层叠上下文的创建: 页面根元素:html z ...
数据可视化实例（三）：散点图（pandas，matplotlib，numpy）
关联 (Correlation) 关联图表用于可视化2个或更多变量之间的关系. 也就是说,一个变量如何相对于另一个变化. 散点图(Scatter plot) 散点图是用于研究两个变量之间关系的经典的和 ...
redis（一)：Redis 数据类型
Redis 数据类型 Redis支持五种数据类型:string(字符串),hash(哈希),list(列表),set(集合)及zset(sorted set:有序集合). String(字符串) st ...
Python之介绍、基本语法、流程控制
本节内容 Python介绍发展史 Python 2 or 3? 安装 Hello World程序变量用户输入模块初识 .pyc是个什么鬼? 数据类型初识数据运算表达式if ...else语 ...