Python数据分析Pandas库数据结构(一)
pandas数据结构
1.生成一维矩阵模拟数据
import pandas as pd
import numpy as np
s = pd.Series([1,2,3,4,np.nan,9,9])
s2 = pd.date_range('20181201',periods=6)#periods周期
2.生成二维矩阵模拟数据
import pandas as pd
import numpy as np
#(1)创建二维矩阵
df = pd.DataFrame([[1,2,3],[4,5,6],[7,8,9]],columns=list('ABC'),index=data_index)
#(2)创建二维矩阵自动生成
df1 = pd.DataFrame(np.arange(1,10).reshape(3,3),columns=list('ABC'),index=data_index)
df1
#(3)字典的方式
data_index = pd.date_range('20181016',periods=3)
df2 = pd.DataFrame({
'A':[1,2,3],
'B':[4,5,6],
'C':[7,8,9]
},index=data_index)
df2
3.排序
索引操作
1.索引默认从0开始
操作列df['列名'] df[['列1','列2'.....]]
操作行:df.loc/at[0] df.loc/at[0:3] df.loc/at[[1,5,6]
2.索引被替换为字符串或时间
操作列,:根据列名操作,无变化,同上
操作行:df.loc[0:3]报错 用df.iloc/iat[0:3]代替
按照条件筛选
df[df>0] 取出所有大于0的元素
df[df.列名>0] 取出对应列大于0的数据
isin([值1,值2..]) 判断数据在列表内.返回True/False
赋值
df['新列名'] = 值 创建新列
df['列名'] = 新值
df.iloc[1:3,'A'] = 值
空值判断
空判断df.isna()返回True/False
填充: df.fillna(value=值) ,如果为空,则用值代替
删除空值:df.dropna(how=any/all)
import pandas as pd
import numpy as np
#重置索引
df2.iloc[1,2] = np.nan
df2
#判断
df2.isna()
#填充数据
df3 = df2.fillna(value='bb')#替换,把空值得数据替换成bb,不操控原数组,
df3
#删除有空值的数据,整行都删除
df2.dropna()
#当数组索引数据都为空的时候才删除数据
df2.dropna(how='all')
df2
#删除有空值的数据,整行都删除,原数组不变
xx = df2.dropna(how='any')
xx
未完待续~~~~~
Python数据分析Pandas库数据结构(一)的更多相关文章
- Python数据分析Pandas库方法简介
Pandas 入门 Pandas简介 背景:pandas是一个Python包,提供快速,灵活和富有表现力的数据结构,旨在使“关系”或“标记”数据的使用既简单又直观.它旨在成为在Python中进行实际, ...
- Python数据分析Pandas库之熊猫(10分钟二)
pandas 10分钟教程(二) 重点发法 分组 groupby('列名') groupby(['列名1','列名2',.........]) 分组的步骤 (Splitting) 按照一些规则将数据分 ...
- Python数据分析Pandas库之熊猫(10分钟一)
pandas熊猫10分钟教程 排序 df.sort_index(axis=0/1,ascending=False/True) df.sort_values(by='列名') import numpy ...
- Python数据分析--Pandas知识点(三)
本文主要是总结学习pandas过程中用到的函数和方法, 在此记录, 防止遗忘. Python数据分析--Pandas知识点(一) Python数据分析--Pandas知识点(二) 下面将是在知识点一, ...
- Python数据分析--Pandas知识点(二)
本文主要是总结学习pandas过程中用到的函数和方法, 在此记录, 防止遗忘. Python数据分析--Pandas知识点(一) 下面将是在知识点一的基础上继续总结. 13. 简单计算 新建一个数据表 ...
- Python的Pandas库简述
pandas 是 python 的数据分析处理库import pandas as pd 1.读取CSV.TXT文件 foodinfo = pd.read_csv("pandas_study. ...
- Python之Pandas库常用函数大全(含注释)
前言:本博文摘抄自中国慕课大学上的课程<Python数据分析与展示>,推荐刚入门的同学去学习,这是非常好的入门视频. 继续一个新的库,Pandas库.Pandas库围绕Series类型和D ...
- python数据分析03Python的数据结构、函数和文件
我们会从Python最基础的数据结构开始:元组.列表.字典和集合.然后会讨论创建你自己的.可重复使用的Python函数.最后,会学习Python的文件对象,以及如何与本地硬盘交互. 3.1 数据结构和 ...
- Python数据分析-Pandas(Series与DataFrame)
Pandas介绍: pandas是一个强大的Python数据分析的工具包,是基于NumPy构建的. Pandas的主要功能: 1)具备对其功能的数据结构DataFrame.Series 2)集成时间序 ...
随机推荐
- csrf 攻击和防御
CSRF概念:CSRF跨站点请求伪造(Cross—Site Request Forgery),跟XSS攻击一样,存在巨大的危害性,你可以这样来理解: 攻击者盗用了你的身份,以你的名义发送恶 ...
- Python Solve UnicodeEncodeError 'gbk' / 'ascii' / 'utf8' codec can't encode character '\x??' in position ? 解决有关Python编码的错误
在Python中,处理中文字符一直是很令人头痛的问题,一言不合就乱码,而且引起乱码的原因也不尽相同,有时候是python本身默认的编码器设置的不对,有时候是使用的IDE的解码器不对,还有的时候是终端t ...
- hdu 2098 分拆素数和(素数)
分拆素数和 Time Limit: 1000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others)Total Submi ...
- P1115 最大子段和
题目描述 给出一段序列,选出其中连续且非空的一段使得这段和最大. 输入输出格式 输入格式: 第一行是一个正整数NNN,表示了序列的长度. 第二行包含NNN个绝对值不大于100001000010000的 ...
- hdu 4544——消灭兔子
游戏规则很简单,用箭杀死免子即可. 箭是一种消耗品,已知有M种不同类型的箭可以选择,并且每种箭都会对兔子造成伤害,对应的伤害值分别为Di(1 <= i <= M),每种箭需要一定的QQ币 ...
- padding 和 float属性
padding = {上内,右内,下内,左内} 内边距 padding:"10, 5,15,20" float = "true" 控件固定住.
- NodePort 只能在node节点上访问,外部无法访问
创建了一个NodePort类型的jenkins service,node port 30000,node节点ip为192.168.56.101, 在node节点上通过浏览器能正常访问http://19 ...
- JavaScript基础知识(DOM)
获取元素的方法 要操作谁,就要先获取谁: 获取元素 1.document.getElementById:通过ID名来获取元素 兼容性: 在IE8以下,会默认把name属性当做id来获取: docume ...
- java.lang.NoClassDefFoundError 错误
练习jfianl,,,配置数据库插件的时候遇到: java.lang.NoClassDefFoundError: com/mchange/v2/c3p0/ComboPooledDataSource 解 ...
- How to enable Linux-PAM on uClinux
By default the uClinux uses the tools provided by busybox firstly. So the init login and passwd are ...