pandas网页操作基础
ipython notebook
命令行输入ipython notebook
此时,浏览器会自动运行并打开ipython网页
基本操作
如上图所示,新建一个项目
导入相关模块,建立一个数据集
制造数据缺失项,并给新插入部分部分赋值
这样就构造了一个二维的DataFrame数组,其中包含了一些空数据
处理空数据一般有两种
dropna(),将含有空值行去掉
fillna(values=5)将空值替换成默认值
pd.isnull(df1) 可以判断元素是否是空数据,加any().any()可以得到是否有空数据的布尔值
按列求平均值计算:(空值不参与计算)
按行求平均值计算:(空值不参与计算)
按列求累加值:(空值不参与计算)
当两个维数不同的数组相减时,被减的数组会复制当前列补全被减数组的维数,空值不参与运算
按行累加
每一列最大值减最小值
apply函数输入的是个序列
value_counts()查看元素出现的次数与.mode()查看出现次数最多的元素
先创建一个随机序列
调用value_counts()
调用.mode()查看出现次数最多的元素
数据合并
先创建一个10*4的数组
(1)调用concat()函数合并数组(concat接受的是一个数组,数组里面是要合并的数组)
查看合并后的数组是否与原数组相等
或
(2)通过merge合并,类似于表join关联
先创建两个数组
调用merge,等价于select * from left inner join right on left.key = right.key;
(3)插入方式合并数组
先创建一个数组
调用append,如果插入列数不同,将为缺失值
分类统计
先创建数组
单个对'A‘’分组,groupby('A')
多分组,groupby([])
数据整形
概括:行索引与列索引做位置互换
先创建一个元组列表
给双层索引重新命名
创建一个8*2的数组
调用stack()函数将列索引变行索引,
调用unstack()将最后一层行索引转换为列索引,每调用一次,取一层行索引转换为列索引
数据透视
概念:根据需求只看数组中的一部分
先创建一个数组
调用pivot_table(),参数为values、index、columns,分别表示要查看的列数据与行索引与列索引范围
比如查看D这一列,以A、B为联合行索引,以C为列索引的数据,如果对应数据不存在则为NaN,如果对应位置有多个值,则为平均值
时间序列
先创建时间序列
根据时间序列创建对应的随机数数组
数据量过大时可以定义采样方法,调用resample()函数
如没两分钟采样求平均值
还有一种创建时间序列的方式:以季度创建
调用to_timestamp()可以转换为时间日期的格式
pandas对于时间的计算相当简单,如
类别数据
先创建一个数组
添加类别数据
查看类别索引,并给类别索引重新赋值,如果对grade排序,并不是以grade排序,而是以raw_grade来排序
数据可视化
先创建一个数组
调用cumsum函数对数据求和
调用plot(),将数据可视化
数据读写
先创建一个数组
调用to_csv('file.csv')将数据写入磁盘
调用pd.read_csv('file.csv')读出磁盘文件数据,加参数指定索引列,否则之前的索引列会被当成数据列产生异常
pandas网页操作基础的更多相关文章
- [SQL]SQL语言入门级教材_SQL数据操作基础(二)
SQL数据操作基础(初级) netnova 于 -- :: 加贴在 数据库探讨: 为了建立交互站点,你需要使用数据库来存储来自访问者的信息.例如,你要建立一个职业介绍服务的站点,你就需要存储诸如个人简 ...
- 爬虫基础---HTTP协议理解、网页的基础知识、爬虫的基本原理
一.HTTP协议的理解 URL和URI 在学习HTTP之前我们需要了解一下URL.URI(精确的说明某资源的位置以及如果去访问它) URL:Universal Resource Locator 统一资 ...
- Pandas 常见操作详解
Pandas 常见操作详解 很多人有误解,总以为Pandas跟熊猫有点关系,跟gui叔创建Python一样觉得Pandas是某某奇葩程序员喜欢熊猫就以此命名,简单介绍一下,Pandas的命名来自于面板 ...
- pandas高级操作
pandas高级操作 import numpy as np import pandas as pd from pandas import DataFrame,Series 替换操作 替换操作可以同步作 ...
- 【软件编程】乐易贵宾VIP教程 - JS改写+网页操作系列教程
JS改写系列教程: 1.MD5加密改写教程(爱拍网登录)2.解密如何快速找到真确的js加密算法3.多重MD5加密改写教程(5173登录)4.DZ论坛登录加密改写5.唯品会手机登录加密改写6.新浪微博密 ...
- 安装Linux系统,学习Linux操作基础
20189230杨静怡 2018-2019-2 <移动平台开发实践>第1周学习总结 安装Linux系统内容总结 一.学习"基于VirtualBox虚拟机安装Ubuntu图文教程& ...
- pandas数据操作
pandas数据操作 字符串方法 Series对象在其str属性中配备了一组字符串处理方法,可以很容易的应用到数组中的每个元素 t = pd.Series(['a_b_c_d','c_d_e',np. ...
- VIM操作基础命令
VIM操作基础命令 1 文件操作 1.1 打开文件 VIM 使用 –o 或 –O 选项打开多个文件,其中 –o 表示垂直并排,例如 vim -o lesson4 lesson5 lesson6.大O表 ...
- WebBrowser网页操作之提取获取元素和标签(完整篇)
最近使用WebBrower做了几个Hook小程序,收集积累如下: using System; using System.Collections.Generic; using System.Linq; ...
随机推荐
- Java编程的逻辑 (86) - 动态代理
本系列文章经补充和完善,已修订整理成书<Java编程的逻辑>,由机械工业出版社华章分社出版,于2018年1月上市热销,读者好评如潮!各大网店和书店有售,欢迎购买,京东自营链接:http: ...
- Java知多少(24)包装类、拆箱和装箱详解
虽然 Java 语言是典型的面向对象编程语言,但其中的八种基本数据类型并不支持面向对象编程,基本类型的数据不具备“对象”的特性——不携带属性.没有方法可调用. 沿用它们只是为了迎合人类根深蒂固的习惯, ...
- 安卓程序代写 网上程序代写[原]vim编辑器配置及常用命令
最近工作不安分, 没有了刚入行时候的锐气, 不知道什么时候开始懈怠起来, 周末在电脑旁边看新闻, 搞笑图片, 追美剧, 一坐就是一天, 很是空虚. 我需要摆脱这种状态, 正好想学习一下安卓底层, An ...
- Python 的 Magic Methods 指南(转)
介绍 本指南是数月博客的总结.主题是魔术方法. 什么是魔术方法呢?它们是面向对象Python语言中的一切.它们是你可以自定义并添加“魔法”到类中的特殊方法.它们被双下划线环绕(比如__init__或_ ...
- 构建工具:grunt、Glup、webpack
相关代码已上传至github 怎么是项目构建? 编译项目中的js, sass, less: 合并js/css等资源文件: 压缩js/css/html等资源文件: JS语法的检查. 构建工具的作用? 简 ...
- 安装redis出现cc adlist.o /bin/sh:1:cc:not found的解决方法
安装redis时 提示执行make命令时提示 CC adlist.o /bin/sh: cc: 未找到命令 问题原因:这是由于系统没有安装gcc环境,因此在进行编译时才会出现上面提示,当安装好gc ...
- LeetCode - 872. Leaf-Similar Trees
Consider all the leaves of a binary tree. From left to right order, the values of those leaves form ...
- C语言结构体初始化(转载)
<代码大全>建议在变量定义的时候进行初始化,但是很多人,特别是新人对结构体或者结构体数组定义是一般不会初始化,或者不知道怎么初始化. 1.初始化 typedef struct _TEST_ ...
- 搞懂MapReduce
MapReduce的主要思想就是将计算任务分发至多台计算机(slave),然后master综合计算机结果.所以就涉及到多台计算机通信和同步的问题,这个应该由hadoop完成,把环境配置好后就像单机操作 ...
- 带分数|2013年蓝桥杯B组题解析第九题-fishers
带分数 100 可以表示为带分数的形式:100 = 3 + 69258 / 714 还可以表示为:100 = 82 + 3546 / 197 注意特征:带分数中,数字1~9分别出现且只出现一次(不包含 ...