Python数据分析基础——读写CSV文件2
2.2筛选特定的行:
- 行中的值满足某个条件
- 行中的值属于某个集合
- 行中的值匹配于某个模式(即:正则表达式)
2.2.1:行中的值满足于某个条件:
- 基础python版:
#!/usr/bin/env python3
import csv
import sys input_file = sys.argv[1]
output_file = sys.argv[2] with open(input_file, 'r', newline = '') as csv_in_file:
with open(output_file, 'w', newline = '') as csv_out_file:
filereader = csv.reader(csv_in_file)
filewriter = csv.writer(csv_out_file)
header = next(filereader) # 使用CSV模块的next函数读出输入文件的第一行
filewriter.writerow(header) # 将标题写入输出文件
for row_list in filereader:
supplier = str(row_list[0]).strip() # 取出每行数据中的供应商名字,赋值给supplier变量
cost = str(row_list[3]).strip('$').replace(',', '') # 使用列表索引
if supplier =='Supplier Z' or float(cost) > 600.0:
filewriter.writerow(row_list)
- pandas版:
#!/usr/bin/env python3 import pandas as pd
import sys input_file = sys.argv[1]
output_file = sys.argv[2] data_frame = pd.read_csv(input_file) data_frame['Cost'] = data_frame['Cost'] = data_frame['Cost'].str.strip('$').astype(float)
data_frame_value_meets_condition = data_frame.loc[(data_frame['Supplier Name'].str.contains('Z')) | (data_frame['Cost'] > 600.0), :] data_frame_value_meets_condition.to_csv(output_file, index = False)
2.2.2:行中的值属于某个集合:
- 基础python:
#!/usr/bin/env python3 # 需求目的:保留那些购买日属于['1/20/14','1/30/2014']
import csv
import sys input_file = sys.argv[1]
output_file = sys.argv[2] important_dates = ['1/20/2014', '1/30/2014'] # 创建了一个列表的名为important_dates的集合,important_dates是一个列表变量,它就是要属于的集合 with open(input_file, 'r', newline = ' ') as csv_in_file:
with open(output_file, 'w', newline = ' ') as csv_out_file:
filereader = csv.reader(csv_in_file) # 使用CSV模块,的reader函数,创建一个文件读取对象,名为filereader,它可以用于读取文章中的行
filewriter = csv.writer(csv_out_file) # 使用CSV模块的writer函数,创建了一个文件输出对象,名为filewriter,他可以用于将这个对象的数据写入输出文件
header = next(filereader) # 使用CSV模块的next函数,读出输入文件的第一行
filewriter.writerow(header) # 将header——标题行,写入输出文件
for row_list in filereader: # 遍历读取的文章的每一行
a_date = row_list[4] # 得到每一行的第5列信息,即为每一行的购买的信息,并将其赋值给变量a_date;这里使用的是索引值4
if a_date in important_dates: # 判断变量a_date是否属于important_dates这个集合
filewriter.writerow(row_list) # 如果是,则将该行数据写入输出文件
pandas:
#!/usr/bin/env python3 import pandas as pd
import sys input_file = sys.argv[1]
output_file = sys.argv[2] data_frame = pd.read_csv(input_file) # 读取输入文件,将其读取成dataframe的形式
data_frame_value_in_set = data_frame.loc[data_frame['Purchase Date'].isin(important_dates), :] # pandas的简洁命令:isin() data_frame_value_in_set.to_csv(output_file,index = False) # 将data_frame_value_in_set的变量值,转换成CSV的形式,写入到输出文件中
行中的值,匹配于某个正则表达式:
- 基础python
1 #!/usr/bin/env python3
import csv
import re # 导入正则表达式模块(re)
import sys
input_file = sys.argv[1]
output_file = sys.argv[2]
pattern = re.compile(r'(?P<my_pattern_group>^001-.*)', re.I) # 使用re模块的compile函数,创建一个名为pattern的正则表达式的变量
with open(input_file, 'r', newline = ' ') as csv_in_file:
with open(output_file, 'w', newline = ' ') as csv_in_file:
filereader = csv.reader(csv_in_file)
filewriter = csv.writer(csv_out_file)
header = next(filereader)
fliewriter.writerow(header)
for row_list in filereader:
invoice_number = row_list[1] #
if pattern.search(invoice_number): # 使用re模块的search函数在invoice_number的值中寻找模式
filewriter.writerow(row_list) # 如果模式出现在invoice_number中,就将这行内容写入输出文件中
pandas
#!/usr/bin/env python3 import pandas as pd
import sys input_file = sys.argv[1]
output_file = sys.argv[2] data_frame = pd.read_csv(input_file)
data_frame_value_matches_pattern = data_frame.loc[data_frame['Invoice Number'].str.startswith("001-"), :]
data_frame_value_matches_pattern.to_csv(output_file, index = False)
Python数据分析基础——读写CSV文件2的更多相关文章
- Python数据分析基础——读写CSV文件
1.基础python代码: #!/usr/bin/env python3 # 可以使脚本在不同的操作系统之间具有可移植性 import sys # 导入python的内置sys模块,使得在命令行中向脚 ...
- python学习之读写csv文件(使用pandas)
简介 逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本).纯文本意味着该文件是一个字符序 ...
- python3读写csv文件
python读取CSV文件 python中有一个读写csv文件的包,直接import csv即可.利用这个python包可以很方便对csv文件进行操作,一些简单的用法如下. 1. 读文件 csv_ ...
- (Python基础教程之十二)Python读写CSV文件
Python基础教程 在SublimeEditor中配置Python环境 Python代码中添加注释 Python中的变量的使用 Python中的数据类型 Python中的关键字 Python字符串操 ...
- 使用Python读写csv文件的三种方法
Python读写csv文件 觉得有用的话,欢迎一起讨论相互学习~Follow Me 前言 逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是 ...
- python读写csv文件
文章链接:https://www.cnblogs.com/cloud-ken/p/8432999.html Python读写csv文件 觉得有用的话,欢迎一起讨论相互学习~Follow Me 前言 逗 ...
- python习题_读写csv格式的文件
1.读写TXT文件 # *_* coding : UTF-8 *_* # 开发人员 : zfy # 开发时间 :2019/7/7 16:26 # 文件名 : lemon_10_file.PY # 开发 ...
- Python数据分析基础PDF
Python数据分析基础(高清版)PDF 百度网盘 链接:https://pan.baidu.com/s/1ImzS7Sy8TLlTshxcB8RhdA 提取码:6xeu 复制这段内容后打开百度网盘手 ...
- 用opencsv文件读写CSV文件
首先明白csv文件长啥样儿: 用excel打开就变成表格了,看不到细节 推荐用其它简单粗暴一点儿的编辑器,比如Notepad++, csv文件内容如下: csv文件默认用逗号分隔各列. 有了基础的了解 ...
随机推荐
- 360、IE等浏览器对bootstrap的影响
笔者开发的web程序部署上线后发现,bootstrap的菜单不显示,开发时候用chrome没有发现问题,在360浏览器上跑,发现360默认的是兼容模式,切换到极速模式就能够显示菜单了. 但是这样的用户 ...
- 交互ajax
原生的js封装ajax1.创建ajax对象var oAjax=new XMLHttpRequest();//不兼容IE6var oAjax=new ActiveXobject('Microsoft.X ...
- Java分代的思考
我们都知道,java的gc是基于java的分代前提,不管是CMS还是G1,都是基于分代思想:老年代和新生代 思考一:为什么可以分代? 1.java中对象的生命周期是不一样的,在gc中对应年龄的概念. ...
- libav(ffmpeg)简明教程(2)
距离上一次教程又过去了将近一个多月,相信大家已经都将我上节课所说的东西所完全消化掉了. 这节课就来点轻松的,说说libav的命令使用吧. 注:遇到不懂的或者本文没有提到的可以用例如命令后加 --hel ...
- WordPress企业建站心得
回头聊聊我用WordPress做企业网站的事.说是企业网站,其实就是一个小的企业展示网站.事情要从我爸开了一家自行车店开始说起,自从他开了自行车店,不但开始学着玩起了微信(因为要做微信营销),又想到了 ...
- UVA Mega Man's Mission(状压dp)
把消灭了那些机器人作为状态S,预处理出状态S下可以消灭的机器人,转移统计方案.方案数最多16!,要用64bit保存方案. #include<bits/stdc++.h> using nam ...
- hdu-1198 Farm Irrigation---并查集+模拟(附测试数据)
题目链接: http://acm.hdu.edu.cn/showproblem.php?pid=1198 题目大意: 有如上图11种土地块,块中的绿色线条为土地块中修好的水渠,现在一片土地由上述的各种 ...
- vuejs组件
<div id='root'> <ul> <todo-item></todo-item> </ul> </div> <sc ...
- 【转】IOS基础:深入理解Objective-c中@class的含义
objective-c中,当一个类使用到另一个类时,并且在类的头文件中需要创建被引用的指针时, 如下面代码: A.h文件 #import "B.h" @interface A : ...
- java面向对象思想1
1.面向对象是面向过程而言.两者都是一种思想.面向过程:强调的是功能行为.(强调过程.动作)面向对象:将功能封装进对象,强调了具备了功能的对象.(强调对象.事物)面向对象是基于面向过程的.将复杂的事情 ...