【Python】读取各种文档(txt、csv、excel、pdf)方法
1.读取txt文件
注意事项:
1..txt文件同下方脚本所在的.py文件需要在同一个文件夹下
- # coding=utf-8
- txt读取
- with open("1233.txt") as file:
- for line in file:
- print(line)
2.读取csv文件
注意事项:
1).csv文件同下方脚本所在的.py文件需要在同一个文件夹下
2).csv文件由来必须是,创建完excel文件后另存为csv文件,如果只是修改后缀名读取是不能成功读到csv文件中的内容的。
- # coding=utf-8
- import csv
- csv_file = open('csvfile_input.csv','r')
- reader=csv.reader(csv_file)
- for item in reader:
- print(item)
3)读取+写入在一起时候的组合代码
- # 读取csv文件方式2
- csvFile = open("csvfile_input.csv", "r")
- reader = csv.reader(csvFile) # 返回的是迭代类型
- data = []
- for item in reader:
- print(item)
- data.append(item)
- print(data)
- #csvFile.close()
- # 从列表写入csv文件
- csvFile2 = open('csvFile3.csv', 'w', newline='') # 设置newline,否则两行之间会空一行
- writer = csv.writer(csvFile2)
- m = len(data)
- for i in range(m):
- writer.writerow(data[i])
- csvFile2.close()
3.读取excel文件
文件内容(文件所在位置:E:\script\python-script\TestData.xlsx):
- # -*- coding: utf-8 -*-
- import xlrd
- from datetime import date,datetime
- def read_excel():
- ExcelFile=xlrd.open_workbook(r'E:\script\python-script\TestData.xlsx')
- #获取目标EXCEL文件sheet名
- print(ExcelFile.sheet_names())
- #------------------------------------
- #若有多个sheet,则需要指定读取目标sheet例如读取sheet2
- #sheet2_name=ExcelFile.sheet_names()[1]
- #------------------------------------
- #获取sheet内容【1.根据sheet索引2.根据sheet名称】
- #sheet=ExcelFile.sheet_by_index(1)
- sheet=ExcelFile.sheet_by_name('TestCase002')
- #打印sheet的名称,行数,列数
- print(sheet.name,sheet.nrows,sheet.ncols)
- #获取整行或者整列的值
- rows=sheet.row_values(2)#第三行内容
- cols=sheet.col_values(1)#第二列内容
- print(cols,rows)
- #获取单元格内容
- print(sheet.cell(1,0).value.encode('utf-8'))
- print(sheet.cell_value(1,0).encode('utf-8'))
- print(sheet.row(1)[0].value.encode('utf-8'))
- #打印单元格内容格式
- print(sheet.cell(1,0).ctype)
- if __name__ == '__main__':
- read_excel()
运行结果:
4.读取pdf文件(暂不研究)
【Python】读取各种文档(txt、csv、excel、pdf)方法的更多相关文章
- Python读取word文档内容
1,利用python读取纯文字的word文档,读取段落和段落里的文字. 先读取段落,代码如下: 1 ''' 2 #利用python读取word文档,先读取段落 3 ''' 4 #导入所需库 5 fro ...
- Python读取word文档(python-docx包)
最近想统计word文档中的一些信息,人工统计的话...三天三夜吧 python 不愧是万能语言,发现有一个包叫做 docx,非常好用,具体查看官方文档:https://python-docx.read ...
- python读取word文档
周末需要做一个统计word文档字数的问题,刚开始以为很简单,因为之前做过excel表格相关的任务,所以认为利用扩展模块应该比较简单. 通过搜索,确实搜到了一个python操作word的模块,pytho ...
- 2018-10-04 [日常]用Python读取word文档中的表格并比较
最近想对某些word文档(docx)的表格内容作比较, 于是找了一下相关工具. 参考Automate the Boring Stuff with Python中的word部分, 试用了python-d ...
- Python读取本地文档内容并发送邮件
当需要将本地某个路径下的文档内容读取后并作为邮件正文发送的时候可以参考该文,使用到的模块包括smtplib,email. #! /usr/bin/env python3 # -*- coding:ut ...
- Mac OS X将CSV格式转换为Excel文档格式,Excel转CSV中文乱码问题
一:在Mac上假设你使用Excel打开windows导出的CSV格式文档.你会发现表格中全部的的内容都显示在A列. 那么,怎样恢复正常呢,你能够将CSV格式的文档导入到Excel文档中,这样就正常显示 ...
- 编写Java程序,在硬盘中选取一个 txt 文件,读取该文档的内容后,追加一段文字“[ 来自新华社 ]”,保存到一个新的 txt 文件内
查看本章节 查看作业目录 需求说明: 在硬盘中选取一个 txt 文件,读取该文档的内容后,追加一段文字"[ 来自新华社 ]",保存到一个新的 txt 文件内 实现思路: 创建 Sa ...
- python 分词计算文档TF-IDF值并排序
文章来自于我的个人博客:python 分词计算文档TF-IDF值并排序 该程序实现的功能是:首先读取一些文档,然后通过jieba来分词,将分词存入文件,然后通过sklearn计算每一个分词文档中的tf ...
- java中读取word文档里的内容
package com.cn.peitest.excel.word; import java.io.FileInputStream; import java.io.FileOutputStream; ...
- python+selenium自动化软件测试(第12章):Python读写XML文档
XML 即可扩展标记语言,它可以用来标记数据.定义数据类型,是一种允许用户对自己的标记语言进 行定义的源语言.xml 有如下特征: 首先,它是有标签对组成:<aa></aa> ...
随机推荐
- jquery-根据现有结果集得到另一个结果集(后代、祖先或兄弟元素)
1.获取后代元素 1)children() 不传参数:得到结果集内所有元素的子元素 传入选择器:得到结果集内元素的匹配传入选择器的子元素 2)find() 传入选择器:得到匹配选择器的后代元素 传入j ...
- myEclipse svn 插件安装
MyEclipse6.0 安装svn插件 博客分类: 技术 只说一种在线安装流程: 1. 打开Myeclipse,在菜单栏中选择Help→Software Updates→Find and Ins ...
- linux安装ant
1.从http://ant.apache.org 上下载tar.gz版ant 2.复制到/usr下 3.tar -vxzf apahce-ant-1.9.2-bin.tar.gz 解压 4.chow ...
- gradle教程 [原创](eclipse/ADT下 非插件 非Android Studio/AS)纯手打 第三篇:gradle完整的实战
上两篇的地址 安装配置 http://www.cnblogs.com/uncle2000/p/4276833.html 简单实战 http://www.cnblogs.com/uncle2000/p/ ...
- ChemDraw教程:如何查看和删除俗名
化学范畴里,允许用俗名表示ChemDraw原子标记或原子标记的一部分,可以定义俗名的快捷键也可以自由查看或删除俗名,熟练掌握可以提高ChemDraw软件使用效率,下面将具体介绍此部分内容. 一.查看俗 ...
- android webView不简单
手机屏幕大小非常伤程序猿 励志成为一名Javaproject师的我.真的被它伤到了,不仅由于webView的强大.并且这个内容适合各样屏幕大小问题. 想当年苹果project师嘲笑安卓project师 ...
- Python Scrapy 自动爬虫注意细节(2)
一.自动爬虫的创建,需要指定模版 如: scrapy genspider -t crawl stockinfo quote.eastmoney.com crawl : 爬虫模版 stockinfo : ...
- CentOS5.5环境下布署LVS+keepalived
原创作品,允许转载,转载时请务必以超链接形式标明文章 原始出处 .作者信息和本声明.否则将追究法律责任.http://kerry.blog.51cto.com/172631/401253 #!/bin ...
- nginx 重复提交 重复请求问题
我遇到的奇葩问题. 后台使用的是nginx + tomcat 前端页面确实只发送了一个ajax请求到后台. 后台却接收到了两条请求! 百度了一下,说是因为nginx负载均衡,一个请求超时后会重复发送一 ...
- mysql show processlist 命令检查mysql lock
processlist命令的输出结果显示了有哪些线程在运行,可以帮助识别出有问题的查询语句,两种方式使用这个命令. 1. 进入mysql/bin目录下输入mysqladmin processlist; ...