这几天遇到比较多的dataframe操作,频繁使用,在此整理记录下,方便查找. 1.num为列的数字序号,name=df.columns[num],返回的是column的字符串名字,df[name]=df[df.columns[num]]=df['xxx'] 2.关于panda中dataframe的与&运算,详情见我的博客,链接:https://www.cnblogs.com/Rvin/p/9504341.html  df_am = df[ np.array(df['MDTime']>=93…
1.Pandas对数据某一列删除 1.删除列 import pandas as pd df = pd.read_csv(file) #axis=1就是删除列 df.drop(['列名1','列名2'], axis=1) 2.删除记录,也就是行 import pandas as pd df = pd.read_csv(file) #axis=0就是删除记录也就是行 df.drop([0,1,3], axis=0) 2.Pandas之修改列名 1.第一种是没有表头,想要添加表头 因为csv文件是没有…
一.Series的创建: pd.Series([ 数据 ]) In [17]: import pandas as pd In [18]: import numpy as np In [19]: s = pd.Series([1,1,1,1,np.nan]) In [20]: s Out[20]: 0 1.0 1 1.0 2 1.0 3 1.0 4 NaN dtype: float64 二.生成DataFrame 1,Numpy 产生随机数组 In [17]: np.random.rand(5,5…
本文原创,转载请标识出处: http://www.cnblogs.com/xiaoxuebiye/p/7223774.html 导入数据: pd.read_csv(filename):从CSV文件导入数据 pd.read_table(filename):从限定分隔符的文本文件导入数据 pd.read_excel(filename):从Excel文件导入数据 pd.read_sql(query, connection_object):从SQL表/库导入数据 pd.read_json(json_st…
本篇重点讲解windows系统下 Python3.5中第三方excel操作库-openpyxl: 其实Python第三方库有很多可以操作Excel,如:xlrd,xlwt,xlwings甚至注明的数据分析模块Pandas也提供pandas.read_excel.pandas.DataFrame.to_excel功能. 那么openpyxl的库有哪些优缺点呢: 优势: 1.openpyxl提供对pandas的dataframe对象完美支持: 2.openpyxl支持后台静默打开excel文件: 3…
准备工作 import numpy as np import pandas as pd 倒入文件或创建一个数据表 df = pd.DataFrame(pd.read_csv('name.csv',header=1)) df = pd.DataFrame(pd.read_excel('name.xlsx')) pd.read_table(filename)# 从限定分隔符的文本文件导入数据 pd.read_excel(filename)# 从Excel文件导入数据 pd.read_sql(quer…
整理pandas操作 本文原创,转载请标识出处: http://www.cnblogs.com/xiaoxuebiye/p/7223774.html 导入数据: pd.read_csv(filename):从CSV文件导入数据 pd.read_table(filename):从限定分隔符的文本文件导入数据 pd.read_excel(filename):从Excel文件导入数据 pd.read_sql(query, connection_object):从SQL表/库导入数据 pd.read_j…
pandas的操作 pandas的拼接操作 # pandas的拼接操作 级联 pd.concat , pd.append 合并 pd.merge , pd.join 一丶pd.concat()级联 # pandas使用pd.concat函数,与np.concatenate函数类似,只是多了一些参数: # 参数说明: objs axis=0 # 方向 1 是 行, 0是 列 keys join='outer' / 'inner':表示的是级联的方式,outer会将所有的项进行级联(忽略匹配和不匹配…
从头到尾都是手码的,文中的所有示例也都是在Pycharm中运行过的,自己整理笔记的最大好处在于可以按照自己的思路来构建矿建,等到将来在需要的时候能够以最快的速度看懂并应用=_= 注:为方便表述,本章设s为pandas.core.series.Series的一个实例化对象,设df为pandas.core.frame.DataFrame的一个实例化对象 1. Pandas简介 Pandas是基于NumPy的python数据分析库,最初被作为金融数据分析工具而开发出来,因此Pandas为时间序列分析提…
Pandas pandas需要导入 import pandas as pd from pandas import Series,DataFrame import numpy as np 1 Series Series是一种类似与一维数组的对象,由下面两个部分组成: values:一组数据(ndarray类型) index:相关的数据索引标签 Series的创建:默认索引为0到N-1的整数型索引 由列表创建 由numpy数组创建 #使用列表创建Series Series(data=[1,2,3])…
1.读取csv import pandas as pd df = pd.read_csv('路径/py.csv') 2.取行号 index_num = df.index 举个例子: import pandas as pd df = pd.read_csv('./IP2LOCATION.csv',encoding= 'utf-8') index_num = df.index print(index_num) 3.取出行 import pandas as pd df = pd.read_csv('.…
判断两列数据是否相同,有以下几个函数判断(做笔记于此,方便以后查找): 1.=IF(AND(A4=B4),"相同","") 在C列输出相同字符 2.=IF(A1=B1,B1,"") 在C列输出相同的B1值 =IF(A1=B1,A1,"") 在C列输出相同的A1值 两个公式输出的值应相同 3.=VLOOKUP(A1,B:B,1,false) 参数解释:(查找值,查询区域,返回列,查找方式:精确或模糊查找) 函数作用:搜索指定区域…
Python Pandas操作Excel 前情提要 ☟ 本章使用的 Python3.6 Pandas==0.25.3 项目中需要用到excel的文件字段太多 考虑到后续字段命名的变动以及中文/英文/日文...等多国语言的校验 操作麻烦 后改进的操作方式 测试文件点击下载 Pandas中文文档 Pandas中文文档 # 安装pandas # -i https://pypi.douban.com/simple/ 国内镜像加速 pip insatll pandas==0.25.3 -i https:/…
原文 [译]在Asp.Net中操作PDF - iTextSharp - 利用列进行排版 在使用iTextSharp通过ASP.Net生成PDF的系列文章中,前面的文章已经讲述了iTextSharp所涵盖的大多数基本功能.本文主要讲述通过另外一种方法来对文档进行排版,那就是使用列(columns).本系列之前的文章如下: 在ASP.NET中创建PDF-iTextSharp起步 在Asp.Net中操作PDF - iTextSharp - 使用字体 在Asp.Net中操作PDF – iTextShar…
pandas移花接木 数据准备两表: 我们接下来要进行的操作: 增 将两表进行合并 # 把两张表合并,但是这样有问题,索引会重复的进行0-19 students = page_001.append(page_002) students # 我们需要做一步操作,将索引全部重新排列,reset_index同时还要将原索引删除drop=True,这样就OK students.reset_index(drop=True) 追加一行数据到最后 # 这里必须开启ignore_index告诉pandas直接给…
cut 切割,简单的取列命令. -d 指定分隔符 -f 数字 取第几列 -c n-m 取n列到m列字符. //提取字符,不常用 例如:已知bqh.txt文件里的内容为“I am bqh myqq is 1147076062”现在需要文件中过滤出"bqh"和"1147076062"字符串,如何实现? ①awk '{print $3" "$6}' bqh.txt ②cut -d " " -f 3,6 bqh.txt ③cut -c…
[译]在Asp.Net中操作PDF - iTextSharp - 利用列进行排版   在使用iTextSharp通过ASP.Net生成PDF的系列文章中,前面的文章已经讲述了iTextSharp所涵盖的大多数基本功能.本文主要讲述通过另外一种方法来对文档进行排版,那就是使用列(columns).本系列之前的文章如下: 在ASP.NET中创建PDF-iTextSharp起步 在Asp.Net中操作PDF - iTextSharp - 使用字体 在Asp.Net中操作PDF – iTextSharp…
##操作单列#操作A到C列#操作1到3行#指定一个范围遍历所有行和列#获取所有行#获取所有列 #coding=utf-8 from openpyxl import Workbook wb=Workbook() ws1=wb.active ws1["A1"]=1 ws1["A2"]=2 ws1["A3"]=3 ws1["B1"]=4 ws1["B2"]=5 ws1["B3"]=6 ws1[…
public void ExportPermissionRoleData(string search, int roleStatus) { var workbook = new HSSFWorkbook(); ); string fileName = HttpUtility.UrlEncode("sheet" + random + ".xls", System.Text.Encoding.UTF8); #region 表头 ISheet worksheet = wo…
在使用pandas进行条件筛选时,使用了如下的代码: fzd_index=data[(data['实际辐照度']<mi)or(data['实际辐照度']>ma)].index 原本以为,并没有太大的问题.但是出现了ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().” 这样的报错. 正确方式: fzd_index=data[(data.…
# -*- coding: utf-8 -*- # author:baoshan import pandas as pd def main(): aqi_data = pd.read_csv('china_city_aqi_teacher.csv') print('基本信息:') print(aqi_data.info()) print('数据预览') print(aqi_data.head(5)) # 基本统计 print('AQI最大值', aqi_data['AQI'].max()) pr…
目录 1. 数据文件 2. 读数据 3. 查找数据 4. 替换数据 4.1 一对一替换 4.2 多对一替换 4.3 多对多替换 5. 插入数据 6. 删除数据 6.1 删除列 6.2 删除行 7. 处理缺失值 7.1 数据准备 7.2 查看缺失值 7.3 删除缺失值 7.4 缺失值的填充 8. 处理重复值 8.1 删除重复行 8.2 删除某一列中的重复值 8.3 获取唯一值 9 排序数据 9.1 用sort_values()函数排序数据 9.2 用rank()函数获取数据的排名 10 rank(…
做项目的过程中,发现一次远程链接数据库的耗时大概是300ms~400ms,切身体会到了前辈们经常说的减少链接的重要性,用了缓存后页面的打开时间从1.5s减少到400ms 前提: 那么来说一说正题,web中多标签多条件筛选的设计.有两个思路: 一种是通过页面刷新来获取数据 一种是通过ajax来异步获取数据 思考: 大的方向两条,分支很多,想搜索一下有没有最优方案,似乎找不到. spike: //js来获取用户点击的标签,拼装url,再用window.location.href=url来跳转. a标…
Pivot allows you to transform or reshape data.Pivot 可以帮助我们改变数据的格式, 下面两个例子可以作为参考: 下面来看下具体实现, 首先引入一个 csv 文件(已上传) df = pd.read_csv('/Users/rachel/Sites/pandas/py/pandas/10_pivot/weather.csv') 输出:格式转换, 设置 'date' 为索引列, 也就让'date' 做每一行的输出依据, 然后设置'city' 为每一列…
我们知道,在 Excel 中,行数用数字表示,而列数是用字母表示的(如下图所示),有时候需要把它转换成数字来使用,或者把数字转换成字母.(例如使用POI操作Excel) 下面是转换代码,用来进行字母和数字之间的转换: /** * 将以字母表示的Excel列数转换成数字表示 * * @author WuQianLing * @param letter * 以字母表示的列数,不能为空且只允许包含字母字符 * @return 返回转换的数字,转换失败返回-1 */ public static int…
用织梦实现筛选的功能,其实主要就是运用到了织梦的高级搜索功能,然后用ajax去post替换掉本来的结果就可以了. 其实筛选的话,主要有两个问题需要解决,一个是前台的筛选实现,一个是后台根据前台的点击,反馈出相应的结果. 于是在网上搜索了N多的资料了之后,先实现前台的功能,就是你点了之后会有一个筛选的效果出来,当然,也只是一个效果.具体可以参照:jquery仿京东筛选效果.下面就一步一步用织梦来实现这样的功能. 首先我们先在后台自定义模型(自定义模型都不会的同学,可以直接去面壁思过了) 看到参照网…
需求来自于,模糊查找当天的所有记录,并查找对应列的记录数 public static void main(String[] args) throws Exception{ //创建HBase连接 Configuration conf = HBaseConfiguration.create(); //设定需要查询的表 HTable table = new HTable(conf,"EVENT_LOG_LBS_HIS"); Scan scan = new Scan(); //设定模糊时间戳…
求解:php商品条件筛选功能你是怎么做出来的? 2013-09-25 13:43 chenhang607 | 浏览 2756 次 资源共享 求思路或者方法,最好能有些代码 2013-09-25 14:14 提问者采纳   php按条件筛选商品的功能,还是比较简单的.其实就是根据不同的条件组成SQL查询条件,从数据库里查出不同的商品出来.举个例子:用户可以按价格范围.按品牌.按商品名称这几项来综合查询.那么,在用户选择了上面这些查询条件后(可能这3个条件都设置了,也可能只设置了其中2个),提交到服…
接到一个任务,由于数据操作人员不会使用编辑公式进而无法进行相关筛选,所以要我帮忙.好久不碰Excel了,那就试试看吧. 需求是这样子的(这里做了最大化的简化):要求判断条件,男50岁以上,女40岁以上将对应列进行填充,以便于后续多条件筛选. 公式:=IF(G2="男",IF(TEXT(NOW(),"yyyy")-TEXT(F2,"yyyy")>=50,"困难",""),IF(TEXT(NOW(),&q…
如下图所示,如何实现Excel自带的筛选功能呢?(对的,就是软件自带的功能) 如何实现: B13的公式:=IFERROR(INDEX(B:B,SMALL(IF(A$1:A$10=B$12,ROW($1:$10)),ROW(A1))),"") C13的公式:=IFERROR(INDEX(C:C,SMALL(IF(A$1:A$10=B$12,ROW($1:$10)),ROW(A1))),"") 一.对B12设置数据有效性: 先设置数据源F12:F15,包含所有类别的问题…