pandas数据结构

1.生成一维矩阵模拟数据

import pandas as pd
import numpy as np
s = pd.Series([1,2,3,4,np.nan,9,9])
s2 = pd.date_range('20181201',periods=6)#periods周期

2.生成二维矩阵模拟数据

import pandas as pd
import numpy as np
#(1)创建二维矩阵
df = pd.DataFrame([[1,2,3],[4,5,6],[7,8,9]],columns=list('ABC'),index=data_index)
#(2)创建二维矩阵自动生成
df1 = pd.DataFrame(np.arange(1,10).reshape(3,3),columns=list('ABC'),index=data_index)
df1
#(3)字典的方式
data_index = pd.date_range('20181016',periods=3)
df2 = pd.DataFrame({
   'A':[1,2,3],
   'B':[4,5,6],
   'C':[7,8,9]
},index=data_index)
df2

3.排序

索引操作

1.索引默认从0开始

  • 操作列df['列名'] df[['列1','列2'.....]]

  • 操作行:df.loc/at[0] df.loc/at[0:3] df.loc/at[[1,5,6]

2.索引被替换为字符串或时间

  • 操作列,:根据列名操作,无变化,同上

  • 操作行:df.loc[0:3]报错 用df.iloc/iat[0:3]代替

按照条件筛选

  • df[df>0] 取出所有大于0的元素

  • df[df.列名>0] 取出对应列大于0的数据

  • isin([值1,值2..]) 判断数据在列表内.返回True/False

赋值

  • df['新列名'] = 值 创建新列

  • df['列名'] = 新值

  • df.iloc[1:3,'A'] = 值

空值判断

  • 空判断df.isna()返回True/False

  • 填充: df.fillna(value=值) ,如果为空,则用值代替

  • 删除空值:df.dropna(how=any/all)

import pandas as pd
import numpy as np
#重置索引
df2.iloc[1,2] = np.nan
df2

#判断
df2.isna()

#填充数据
df3 = df2.fillna(value='bb')#替换,把空值得数据替换成bb,不操控原数组,
df3

#删除有空值的数据,整行都删除
df2.dropna()

#当数组索引数据都为空的时候才删除数据
df2.dropna(how='all')
df2


#删除有空值的数据,整行都删除,原数组不变
xx = df2.dropna(how='any')
xx

未完待续~~~~~

Python数据分析Pandas库数据结构(一)的更多相关文章

  1. Python数据分析Pandas库方法简介

    Pandas 入门 Pandas简介 背景:pandas是一个Python包,提供快速,灵活和富有表现力的数据结构,旨在使“关系”或“标记”数据的使用既简单又直观.它旨在成为在Python中进行实际, ...

  2. Python数据分析Pandas库之熊猫(10分钟二)

    pandas 10分钟教程(二) 重点发法 分组 groupby('列名') groupby(['列名1','列名2',.........]) 分组的步骤 (Splitting) 按照一些规则将数据分 ...

  3. Python数据分析Pandas库之熊猫(10分钟一)

    pandas熊猫10分钟教程 排序 df.sort_index(axis=0/1,ascending=False/True) df.sort_values(by='列名') import numpy ...

  4. Python数据分析--Pandas知识点(三)

    本文主要是总结学习pandas过程中用到的函数和方法, 在此记录, 防止遗忘. Python数据分析--Pandas知识点(一) Python数据分析--Pandas知识点(二) 下面将是在知识点一, ...

  5. Python数据分析--Pandas知识点(二)

    本文主要是总结学习pandas过程中用到的函数和方法, 在此记录, 防止遗忘. Python数据分析--Pandas知识点(一) 下面将是在知识点一的基础上继续总结. 13. 简单计算 新建一个数据表 ...

  6. Python的Pandas库简述

    pandas 是 python 的数据分析处理库import pandas as pd 1.读取CSV.TXT文件 foodinfo = pd.read_csv("pandas_study. ...

  7. Python之Pandas库常用函数大全(含注释)

    前言:本博文摘抄自中国慕课大学上的课程<Python数据分析与展示>,推荐刚入门的同学去学习,这是非常好的入门视频. 继续一个新的库,Pandas库.Pandas库围绕Series类型和D ...

  8. python数据分析03Python的数据结构、函数和文件

    我们会从Python最基础的数据结构开始:元组.列表.字典和集合.然后会讨论创建你自己的.可重复使用的Python函数.最后,会学习Python的文件对象,以及如何与本地硬盘交互. 3.1 数据结构和 ...

  9. Python数据分析-Pandas(Series与DataFrame)

    Pandas介绍: pandas是一个强大的Python数据分析的工具包,是基于NumPy构建的. Pandas的主要功能: 1)具备对其功能的数据结构DataFrame.Series 2)集成时间序 ...

随机推荐

  1. 通过User-agent进行SQL注入

    声明:本文由Bypass整理并翻译,仅用于安全研究和学习之用. 文章来源:https://hackerone.com/reports/297478 我发现了一个SQL注入漏洞 /dashboard/d ...

  2. ToolBar样式颜色,图标设置

    extends:http://blog.csdn.net/w1054993544/article/details/48339565 <resources> <style name=& ...

  3. PHP实现URL长连接转短连接方法总结

    短链接,通俗来说,就是将长的URL 网址,通过程序计算等方式,转换为简短的网址字符串. 这样的话其好处为:1.内容需要:2.用户友好:3.便于管理. 实现短网址(short URL)系统比较流行的算法 ...

  4. geopandas overlay 函数报错问题解决方案

    前言 这篇文章依旧是基于上一篇文章(使用Python实现子区域数据分类统计)而写,此文章中介绍了使用 geopandas 的 overlay 函数对两个 GeoDataFrame 对象取相交或相异的部 ...

  5. Lucene入门学习二

    接上篇:增删改查 增加:这里不做过多阐述. 删除:删除全部,根据条件删除 修该:先删除,后添加 查询(*):查询所有,精确查询,根据数值范围查询,组合查询,解析查询. package com.ithe ...

  6. python使用matplotlib绘制折线图教程

    Matplotlib是一个Python工具箱,用于科学计算的数据可视化.借助它,Python可以绘制如Matlab和Octave多种多样的数据图形.下面这篇文章主要介绍了python使用matplot ...

  7. pytorch入门与实践-2.2

    Tensor 1--本质上可以理解为具有不同维度的数组 2--支持的基本运算 |---创建Tensor:  x=t.tensor(x,y) x,y 表示数组的大小 , x=t.rand(x,y), x ...

  8. HDU 2612 - Find a way - [BFS]

    题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=2612 Problem DescriptionPass a year learning in Hangz ...

  9. 查看Sql Server 数据库的内存使用情况

    -- 查询SqlServer总体的内存使用情况 select type , sum(virtual_memory_reserved_kb) VM_Reserved , sum(virtual_memo ...

  10. weui开发笔记

    1.标准的weui只是一个css皮肤,当然里面有h5特性所以有一些很好的组件,比如时间选择控件.数字输入框(用于手机号等),在ios——微信中可以做到完美的展示. 2.ui框架以手机移动端为优先显示( ...