pandas操作excle

Python是一门强大的编程语言，也是数据科学领域中最流行的语言之一。在处理数据时，很多时候需要与Excel进行交互，以进行数据读取、清理和分析。Python中有很多工具可以与Excel进行交互，其中pandas是其中最受欢迎的库之一。在本文中，我们将介绍如何使用Python和pandas进行Excel文件操作，并讨论一些常用的pandas方法。

读取Excel文件：

import pandas as pd

df = pd.read_excel('example.xlsx')

读取指定的Excel表单：

df = pd.read_excel('example.xlsx', sheet_name='Sheet1')

写入数据到Excel文件：

df.to_excel('example.xlsx', sheet_name='Sheet1', index=False)

追加数据到Excel文件：

with pd.ExcelWriter('example.xlsx', mode='a') as writer:

    df.to_excel(writer, sheet_name='Sheet1', index=False)

选择Excel表单中的列：

df = pd.read_excel('example.xlsx')

selected_cols = ['col1', 'col2']

df_selected = df[selected_cols]

选择Excel表单中的行：

df = pd.read_excel('example.xlsx')

selected_rows = df.loc[df['col1'] == 'value1']

过滤Excel表单中的行：

df = pd.read_excel('example.xlsx')

filtered_rows = df[df['col1'].str.contains('value')]

按列排序：

df = pd.read_excel('example.xlsx')

sorted_df = df.sort_values(by='col1')

按列分组并求和：

df = pd.read_excel('example.xlsx')

grouped_df = df.groupby('col1').sum()

对Excel表单中的列应用函数：

df = pd.read_excel('example.xlsx')

df['new_col'] = df['col1'].apply(lambda x: x * 2)

使用Pivot表：

df = pd.read_excel('example.xlsx')

pivot_table = pd.pivot_table(df, values='col1', index='col2', columns='col3', aggfunc='sum')

插入新的行：

df = pd.read_excel('example.xlsx')

new_row = pd.DataFrame({'col1': 'value1', 'col2': 'value2'}, index=[0])

df = pd.concat([new_row, df]).reset_index(drop=True)

插入新的列：

df = pd.read_excel('example.xlsx')

new_col = pd.Series(['value1', 'value2'])

df['new_col'] = new_col

删除行：

df = pd.read_excel('example.xlsx')

df = df.drop(df[df['col1'] == 'value1'].index)

删除列：

df = pd.read_excel('example.xlsx')

df = df.drop('col1', axis=1)

重命名列：

df = pd.read_excel('example.xlsx')

df = df.rename(columns={'col1': 'new_col1', 'col2': 'new_col2'})

修改单元格的值：

df = pd.read_excel('example.xlsx')

df.loc[df['col1'] == 'value1', 'col2'] = 'new_value'

使用多重索引：

df = pd.read_excel('example.xlsx')

df = df.set_index(['col1', 'col2'])

读取多个Excel文件并合并：

import os

path = 'path/to/files'

all_files = os.listdir(path)

all_excels = [file for file in all_files if file.endswith('.xlsx')]

dfs = [pd.read_excel(os.path.join(path, file)) for file in all_excels]

merged_df = pd.concat(dfs)

选择特定的单元格：

df = pd.read_excel('example.xlsx')

cell_value = df.at[0, 'col1']

拆分Excel表单中的列：

df = pd.read_excel('example.xlsx')

split_cols = df['col1'].str.split('-', expand=True)

split_cols.columns = ['col1_part1', 'col1_part2']

将Excel表单中的列合并：

df = pd.read_excel('example.xlsx')

df['col1'] = df['col1'].astype(str) + '-' + df['col2'].astype(str)

将Excel表单中的日期列格式化：

df = pd.read_excel('example.xlsx')

df['date_col'] = pd.to_datetime(df['date_col'], format='%Y-%m-%d')

根据Excel表单中的某一列填充空值：

df = pd.read_excel('example.xlsx')

df['col1'] = df['col1'].fillna(method='ffill')

根据Excel表单中的某一列去除重复行：

df = pd.read_excel('example.xlsx')

df = df.drop_duplicates(subset='col1')

将Excel表单中的数字列格式化为百分比：

df = pd.read_excel('example.xlsx'

df['percentage_col'] = df['percentage_col'].apply(lambda x: '{:.2%}'.format(x))

将Excel表单中的数字列四舍五入：

df = pd.read_excel('example.xlsx')

df['decimal_col'] = df['decimal_col'].round(2)

根据Excel表单中的某一列进行透视：

df = pd.read_excel('example.xlsx')

pivot_table = pd.pivot_table(df, values='col1', index='col2', columns='col3', aggfunc='sum')

计算Excel表单中列的总数：

df = pd.read_excel('example.xlsx')

col_total = df['col1'].sum()

统计Excel表单中每个值的数量：

df = pd.read_excel('example.xlsx')

value_counts = df['col1'].value_counts()

pandas操作excle的更多相关文章

pandas操作行集锦
pandas移花接木数据准备两表: 我们接下来要进行的操作: 增将两表进行合并 # 把两张表合并,但是这样有问题,索引会重复的进行0-19 students = page_001.append(p ...
pandas操作，感觉不错，复制过来的
整理pandas操作本文原创,转载请标识出处: http://www.cnblogs.com/xiaoxuebiye/p/7223774.html 导入数据: pd.read_csv(filenam ...
Python之Pandas操作csv文件dataframe
# -*- coding: utf-8 -*- # author:baoshan import pandas as pd def main(): aqi_data = pd.read_csv('chi ...
python 操作excle 之第三方库 openpyxl学习
目录 python 操作excle 之第三方库 openpyxl学习安装 pip install openpyxl 英文文档链接 : 点击这里~ 1,定位excel 2,读取excle中的内容 3, ...
Java操作Excle（基于Poi）
有一次有个同事问我会不会有java操作Excle,回答当然是不会了!感觉被嘲讽了,于是开始寻找度娘,找到个小例子,结果越写越有意思,最后就成就了这个工具类. import java.io.Buffer ...
Python Pandas操作Excel
Python Pandas操作Excel 前情提要 ☟ 本章使用的 Python3.6 Pandas==0.25.3 项目中需要用到excel的文件字段太多考虑到后续字段命名的变动以及中文/英文/日 ...
Pandas 操作
一.Series的创建: pd.Series([ 数据 ]) In [17]: import pandas as pd In [18]: import numpy as np In [19]: s = ...
整理pandas操作
本文原创,转载请标识出处: http://www.cnblogs.com/xiaoxuebiye/p/7223774.html 导入数据: pd.read_csv(filename):从CSV文件导入 ...
pandas操作
python中使用了pandas的一些操作,特此记录下来: 生成DataFrame import pandas as pd data = pd.DataFrame({ 'v_id': ["v ...
Python openpyxl、pandas操作Excel方法简介与具体实例
本篇重点讲解windows系统下 Python3.5中第三方excel操作库-openpyxl: 其实Python第三方库有很多可以操作Excel,如:xlrd,xlwt,xlwings甚至注明的数据 ...

随机推荐

POJ3723 Conscription 题解
start: 2021-08-04 16:56:50 题目链接: http://poj.org/problem?id=3723 题目内容: Description Windy has a countr ...
题解，洛谷P3435
根据题意,分析如右图显然,对于每个前缀,有这样的性质A==B==C,所以,周期最长则a最短,即求该字符串的最短公共前后缀.通过kmp算法中nex数组的迭代,很容易求得最短前后缀. for(int i ...
MySQL使用bin-log将数据恢复到某个时间点
binlog的三种模式 statement:记录每一条修改数据的sql row:保存哪条记录被修改 mixed:兼顾前两者的优点. # 查看binlog有没有开启 SHOW VARIABLES LIK ...
反射（Reflect）
反射摘要: 反射是java中非常强大的工具,利用反射可以书写框架,而框架就是半完成的代码.反射就是对类中的各个部分进行封装为其它对象,并且可以随时提取出Class或Object成员的属性,例如成员变量 ...
JavaScript 包装类
<!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title> ...
F - Substring of Sorted String
题目链接题解(树状数组) 我们维护两个树状数组,一个记录 \(1\sim i\) 中 \(s_i>s_{i+1}\)的数量,即逆序对数量,另一个记录 \(1\sim i\) 中 \(26\) ...
alt_flash_open_dev读写EPCS出现“Cannot open flash device”的解决办法
转载 http://www.corecourse.cn/forum.php?mod=viewthread&tid=28317 在对EPCS读写操作时alt_flash_open_dev(EPC ...
看图就会-react条件渲染的5种方式
【Beat】Scrum Meeting 1
时间:2021年6月26日 1.各个成员今日完成的任务以及贡献小时数姓名今日完成任务贡献小时数鑫编写软件的功能测试方案文档,录制视频演示软件系统安装配置过程 4 荣娟编写软件的功能测试方案 ...
Python学习笔记--高阶技巧
闭包(避免全局变量被修改的风险) 函数的嵌套的利用若是只是调用到外部函数的值,只需要用到函数的嵌套,具体实现如下: 若是要对外部函数的值进行修改,需要用到nonlocal关键字,具体实现如下: at ...

pandas操作excle

读取Excel文件：

读取指定的Excel表单：

写入数据到Excel文件：

追加数据到Excel文件：

选择Excel表单中的列：

选择Excel表单中的行：

过滤Excel表单中的行：

按列排序：

按列分组并求和：

对Excel表单中的列应用函数：

使用Pivot表：

插入新的行：

插入新的列：

删除行：

删除列：

重命名列：

修改单元格的值：

使用多重索引：

读取多个Excel文件并合并：

选择特定的单元格：

拆分Excel表单中的列：

将Excel表单中的列合并：

将Excel表单中的日期列格式化：

根据Excel表单中的某一列填充空值：

根据Excel表单中的某一列去除重复行：

将Excel表单中的数字列格式化为百分比：

将Excel表单中的数字列四舍五入：

根据Excel表单中的某一列进行透视：

计算Excel表单中列的总数：

统计Excel表单中每个值的数量：

pandas操作excle的更多相关文章

随机推荐

热门专题