python pandas库的基本内容
pandas主要为数据预处理
DataFrame
import pandas
food_info = pandas.read_csv("路径") #绝对路径和相对路径都可以 type(food_info)为DataFrame
food_info.dtype_ #文件中数据的类型
food_info.head() 读出的数据显示前五条 food_info.head(3) 读出的数据显示前3行 food_info.tail(4)显示末尾4行
food_info.columns 显示列名 food_info.shape 行和列数据规模
food_info.loc[0] 取出第一行数据 food_info[3:6] 3~6行数据
food_info["列名"] 取出列 food_info["列名1","列名2"]
food_info.colums.tolist() #把列名转化为一个list .endswith("(9)") 找出以(g)结尾的列名
food_info["Iron_(mg)"] 以(mg)结尾的 food_info["新列名"] #新加了一列 .max() #求某列的最大值
food_info.sort_valus("列名",inplace = True,ascending = Flase)
#按列名对某一列进行排序,inplace表示新生成一列还是原来的上改 ,ascending = Flase表示从大到小排,NaN 不管升序降序都放到最后
a = pandas.isnull(food_info["列名"]) #看看对应列那些值缺失 food_info[a] 这样就会把有缺失值的一行打印
len(a) #a的数量 food_info["列名"][条件] .mean() 求均值
.pivot_table(index = "列名",values="",aggfunc = np.mean)#index 表示以index为基准,valus表示 值为values的平均数
.pivot_table(index = "列名",values=”列名“) #以index为基准 values列的平均数如果aggfunc未指定就为求均值
.dropna(axis =1)#按行将缺失值对应行去掉 .fillna() 对缺失值填充
fillna参数的取值 : {‘pad’, ‘ffill’,‘backfill’, ‘bfill’, None}, default None
pad/ffill:用前一个非缺失值去填充该缺失值
backfill/bfill:用下一个非缺失值填充该缺失值
None:指定一个值去替换缺失值(缺省默认这种方式)
.reset_index(drop = True) #重新设置了一下index 原来的index 不要了 形成一个新的
def ~自定义一个函数 用.apply(函数名) 去用这个函数
python pandas库的基本内容的更多相关文章
- python pandas库——pivot使用心得
python pandas库——pivot使用心得 2017年12月14日 17:07:06 阅读数:364 最近在做基于python的数据分析工作,引用第三方数据分析库——pandas(versio ...
- Python Pandas库 初步使用
用pandas+numpy读取UCI iris数据集中鸢尾花的萼片.花瓣长度数据,进行数据清理,去重,排序,并求出和.累积和.均值.标准差.方差.最大值.最小值
- Python Pandas库的学习(三)
今天我们来继续讲解Python中的Pandas库的基本用法 那么我们如何使用pandas对数据进行排序操作呢? food.sort_values("Sodium_(mg)",inp ...
- Python——Pandas库入门
一.Pandas库介绍 Pandas是Python第三方库,提供高性能易用数据类型和分析工具 import pandas as pd Pandas基于NumPy实现,常与NumPy和Matplotli ...
- Python pandas库159个常用方法使用说明
Pandas库专为数据分析而设计,它是使Python成为强大而高效的数据分析环境的重要因素. 一.Pandas数据结构 1.import pandas as pd import numpy as np ...
- Python Pandas库的学习(一)
今天我们来学习一下Pandas库,前面我们讲了Numpy库的学习 接下来我们学习一下比较重要的库Pandas库,这个库比Numpy库还重要 Pandas库是在Numpy库上进行了封装,相当于高级Num ...
- Python Pandas库的学习(二)
今天我们继续讲下Python中一款数据分析很好的库.Pandas的学习 接着上回讲到的,如果有人听不懂,麻烦去翻阅一下我前面讲到的Pandas学习(一) 如果我们在数据中,想去3,4,5这几行数据,那 ...
- Python Pandas 库的使用例子
主要在jupyter notebook里面熟悉这个库的使用,它的安装方法与实现,可自行搜索. Pandas是一个优秀的数据分析工具,官网:http://pandas.pydata.org/ 相关的库使 ...
- python numpy库的基本内容
import numpy as np np.getfromtxt("路径",delimiter = "," ,dtype = str) #读取txt文件数据 ...
随机推荐
- 【原创】大叔案例分享(3)用户行为分析--见证scala的强大
一 场景分析 用户行为分析应用的场景很多,像线上网站访问统计,线下客流分析(比如图像人脸识别.wifi探针等),比较核心的指标有几个: PV | UV | SD | SC 指标说明: PV(Page ...
- Vue CLI 3+tinymce 5富文本编辑器整合
基于Vue CLI 3脚手架搭建的项目整合tinymce 5富文本编辑器,vue cli 2版本及tinymce 4版本参考:https://blog.csdn.net/liub37/article/ ...
- 基于Python+Django重定向的例子
Django源码, 这里HttpResponseRedirect和HttpResponsePermanentRedirect没有太大差别,前者是返回302临时重定向,后者返回301永久重定向 clas ...
- PHP中的面向对象思想
<?php header("Content-Type: text/html; charset=gb2312"); class person{ /** * 成员属性 * 在类中 ...
- Python2还是Python3
Python2还是Python3 相信很多新接触Python的人都会纠结这一个问题,学Python2还是Python3? 不像Java一样每个新版本基本都是基本兼容以前的版本的.Python2和Pyt ...
- asp+SqlServer2008开发【第四集:windows server 2008 r2的操作记录】
1,使用powershell server和putty像远程linux一样操作windows服务器,解决使用mstsc命令无法远程桌面的问题. 2,使用IMM管理,使用浏览器查看IBM服务器的工作状况 ...
- Hexo主题yilia增加gitalk评论插件
虽然gitment可以实现评论功能,但是适配方面做的并不好,这里借用GitHub上的gitalk项目用来优化个人博客的评论功能 下面记录自己从gitment到gitalk的替换过程: 1.在layou ...
- 还不知道spring的RestTemplate的妙用吗
为什么要使用RestTemplate? 随着微服务的广泛使用,在实际的开发中,客户端代码中调用RESTful接口也越来越常见.在系统的遗留代码中,你可能会看见有一些代码是使用HttpURLConnec ...
- Linux-vi编辑器简单使用(保证存活)
vi编辑器基本模式 命令行模式(command mode) 光标移动.复制粘贴.删除 插入模式(insert mode) 文字输入 底行模式(last line mode) 保存.退出 模式转换 co ...
- Spark环境搭建(四)-----------数据仓库Hive环境搭建
Hive产生背景 1)MapReduce的编程不便,需通过Java语言等编写程序 2) HDFS上的文缺失Schema(在数据库中的表名列名等),方便开发者通过SQL的方式处理结构化的数据,而不需要J ...