python panda::dataframe常用操作】的更多相关文章

1.条件查询: result = df.query("((a==1 and b=="x") or c/d < 3))" print result 2.遍历 a)根据索引遍历 for idx in df.index: dd = df.loc[idx] print(dd) b)按行遍历 for i in range(0, len(df)): dd = df.iloc[i] print(dd) 3.对某列求均值 # 对“volume”列求均值 result = df…
二叉树是一个重要的数据结构, 本文基于"二叉查找树"的python可视化 pybst 包, 做了一些改造, 可以支持更一般的"二叉树"可视化. 关于二叉树和二叉查找树的概念以及常用操作和算法基础, 可以看后面的参考文章. ===================================二叉查找树可视化包 pybst ===================================pypi 有一个"二叉查找树"的可视化的package,…
spark dataframe派生于RDD类,但是提供了非常强大的数据操作功能.当然主要对类SQL的支持.   在实际工作中会遇到这样的情况,主要是会进行两个数据集的筛选.合并,重新入库.   首先加载数据集,然后在提取数据集的前几行过程中,才找到limit的函数.   而合并就用到union函数,重新入库,就是registerTemple注册成表,再进行写入到HIVE中.   1.union.unionAll.unionByName,row 合并(上下拼接) data_all = data_n…
Python字符串类型 1.用途: 用来记录有描述性的状态.比如:人名,地址等. 2.定义方式: 创建字符串非常简单,在‘ ’,“ ”,‘’‘ ’‘’内一填写一系列的字符例如:msg='hello' 也可以写为msg=str('hello'),str方法可以将其他类型的数据转换成字符串类型,Python不支持单字符类型,单字符在Python也是作为一个字符串使用. 3.常用操作极其内置方法 掌握优先级最高: 1.按照索引取值(正向取,反向取):但是只能取,不能改 例如: 执行结果: 2.切片(顾…
>>> name = "I love my job!" >>> name.capitalize() #首字母大写 'I love my job!' >>> name.count("o") #统计字母个数 2 >>> name.center(50,"-") #输出50个字符,不够以“-”补全,并且name放在中间;name.ljust(50,"-")是从最后…
字典常用的就是,他的去重. set集合是python的一个基本数据类型. set中的元素是不重复的.⽆无序的.⾥面的元素必须是可hash的(int, str, tuple,bool). 我们可以这样来记. set就是dict类型的数据但是不保存value, 只保存key. set也⽤{}表⽰ 注意: set中的元素是不重复的, 且无序的. 使⽤用这个特性.我们可以使⽤用set来去掉重复 set集合中的元素必须是可hash的, 但是set本身是不可hash得. set是可变的. set集合增删改查…
python 2.7 os 常用操作 官方document链接 文件和目录 os.access(path, mode) 读写权限测试 应用: try: fp = open("myfile") except IOError as e: if e.errno == errno.EACCES: return "some default data" # Not a permission error. raise else: with fp: return fp.read()…
直接上代码示例: #!/user/bin env python # author:Simple-Sir # time:20180914 # 字符串常用操作 name = 'lzh lyh' print('capitalize返回值:',name.capitalize()) # 首字母大写 print('count返回值:',name.count('l')) #指定字母数量 print('center返回值:',name.center(50,'-')) #共打印50个字符,不够的用"-"…
上节我们简单介绍了Dataframe的定义,这节我们具体来看一下Dataframe的操作 首先,数据框的创建函数为 data.frame( ),参考R语言的帮助文档,我们来了解一下data.frame( )的具体用法: Usage data.frame(..., row.names = NULL, check.rows = FALSE, check.names = TRUE, fix.empty.names = TRUE, stringsAsFactors = default.stringsAs…
最近学习UI自动化,把一些常用的方法总结一下,方便自己以后查阅需要.因本人水平有限,有不对之处多多包涵!欢迎指正! 一.xpath模糊匹配定位元素 武林至尊,宝刀屠龙刀(xpath),倚天不出(css),谁与争锋 学会了xpath,妈妈再也不用担心我定位不到元素啦 ^_^ # coding:utf-8 import time from selenium import webdriver driver = webdriver.Chrome() driver.get("https://www.bai…