【Python】读取各种文档(txt、csv、excel、pdf)方法
1.读取txt文件
注意事项:
1..txt文件同下方脚本所在的.py文件需要在同一个文件夹下
- # coding=utf-8
- txt读取
- with open("1233.txt") as file:
- for line in file:
- print(line)
2.读取csv文件
注意事项:
1).csv文件同下方脚本所在的.py文件需要在同一个文件夹下
2).csv文件由来必须是,创建完excel文件后另存为csv文件,如果只是修改后缀名读取是不能成功读到csv文件中的内容的。
- # coding=utf-8
- import csv
- csv_file = open('csvfile_input.csv','r')
- reader=csv.reader(csv_file)
- for item in reader:
- print(item)
3)读取+写入在一起时候的组合代码
- # 读取csv文件方式2
- csvFile = open("csvfile_input.csv", "r")
- reader = csv.reader(csvFile) # 返回的是迭代类型
- data = []
- for item in reader:
- print(item)
- data.append(item)
- print(data)
- #csvFile.close()
- # 从列表写入csv文件
- csvFile2 = open('csvFile3.csv', 'w', newline='') # 设置newline,否则两行之间会空一行
- writer = csv.writer(csvFile2)
- m = len(data)
- for i in range(m):
- writer.writerow(data[i])
- csvFile2.close()
3.读取excel文件
文件内容(文件所在位置:E:\script\python-script\TestData.xlsx):
- # -*- coding: utf-8 -*-
- import xlrd
- from datetime import date,datetime
- def read_excel():
- ExcelFile=xlrd.open_workbook(r'E:\script\python-script\TestData.xlsx')
- #获取目标EXCEL文件sheet名
- print(ExcelFile.sheet_names())
- #------------------------------------
- #若有多个sheet,则需要指定读取目标sheet例如读取sheet2
- #sheet2_name=ExcelFile.sheet_names()[1]
- #------------------------------------
- #获取sheet内容【1.根据sheet索引2.根据sheet名称】
- #sheet=ExcelFile.sheet_by_index(1)
- sheet=ExcelFile.sheet_by_name('TestCase002')
- #打印sheet的名称,行数,列数
- print(sheet.name,sheet.nrows,sheet.ncols)
- #获取整行或者整列的值
- rows=sheet.row_values(2)#第三行内容
- cols=sheet.col_values(1)#第二列内容
- print(cols,rows)
- #获取单元格内容
- print(sheet.cell(1,0).value.encode('utf-8'))
- print(sheet.cell_value(1,0).encode('utf-8'))
- print(sheet.row(1)[0].value.encode('utf-8'))
- #打印单元格内容格式
- print(sheet.cell(1,0).ctype)
- if __name__ == '__main__':
- read_excel()
运行结果:
4.读取pdf文件(暂不研究)
【Python】读取各种文档(txt、csv、excel、pdf)方法的更多相关文章
- Python读取word文档内容
1,利用python读取纯文字的word文档,读取段落和段落里的文字. 先读取段落,代码如下: 1 ''' 2 #利用python读取word文档,先读取段落 3 ''' 4 #导入所需库 5 fro ...
- Python读取word文档(python-docx包)
最近想统计word文档中的一些信息,人工统计的话...三天三夜吧 python 不愧是万能语言,发现有一个包叫做 docx,非常好用,具体查看官方文档:https://python-docx.read ...
- python读取word文档
周末需要做一个统计word文档字数的问题,刚开始以为很简单,因为之前做过excel表格相关的任务,所以认为利用扩展模块应该比较简单. 通过搜索,确实搜到了一个python操作word的模块,pytho ...
- 2018-10-04 [日常]用Python读取word文档中的表格并比较
最近想对某些word文档(docx)的表格内容作比较, 于是找了一下相关工具. 参考Automate the Boring Stuff with Python中的word部分, 试用了python-d ...
- Python读取本地文档内容并发送邮件
当需要将本地某个路径下的文档内容读取后并作为邮件正文发送的时候可以参考该文,使用到的模块包括smtplib,email. #! /usr/bin/env python3 # -*- coding:ut ...
- Mac OS X将CSV格式转换为Excel文档格式,Excel转CSV中文乱码问题
一:在Mac上假设你使用Excel打开windows导出的CSV格式文档.你会发现表格中全部的的内容都显示在A列. 那么,怎样恢复正常呢,你能够将CSV格式的文档导入到Excel文档中,这样就正常显示 ...
- 编写Java程序,在硬盘中选取一个 txt 文件,读取该文档的内容后,追加一段文字“[ 来自新华社 ]”,保存到一个新的 txt 文件内
查看本章节 查看作业目录 需求说明: 在硬盘中选取一个 txt 文件,读取该文档的内容后,追加一段文字"[ 来自新华社 ]",保存到一个新的 txt 文件内 实现思路: 创建 Sa ...
- python 分词计算文档TF-IDF值并排序
文章来自于我的个人博客:python 分词计算文档TF-IDF值并排序 该程序实现的功能是:首先读取一些文档,然后通过jieba来分词,将分词存入文件,然后通过sklearn计算每一个分词文档中的tf ...
- java中读取word文档里的内容
package com.cn.peitest.excel.word; import java.io.FileInputStream; import java.io.FileOutputStream; ...
- python+selenium自动化软件测试(第12章):Python读写XML文档
XML 即可扩展标记语言,它可以用来标记数据.定义数据类型,是一种允许用户对自己的标记语言进 行定义的源语言.xml 有如下特征: 首先,它是有标签对组成:<aa></aa> ...
随机推荐
- 利用jstack 找到异常代码
1.top找出耗时pid进程或ps -ef |grep xxx 找出pid 2.ps p 3036 -L -o pcpu,pid,tid,time,tname,cmd 3036为pid 3.prin ...
- phpcms v9如何更改分页显示条数?
默认显示页码数有10条,比如想更改成显示3条,例如这样 上一页 1 2 3...34 下一页 更改phpcms\libs\functions\global.func.php,找到分页函数,大概在665 ...
- 也谈谈Unity的transform使用
一.Transform和transform 我们来详谈Unity的transform使用,这里所说的tansform不是类UnityEngine命名空间下的Transform,而是transform. ...
- orcale增量全量实时同步mysql可支持多库使用Kettle实现数据实时增量同步
1. 时间戳增量回滚同步 假定在源数据表中有一个字段会记录数据的新增或修改时间,可以通过它对数据在时间维度上进行排序.通过中间表记录每次更新的时间戳,在下一个同步周期时,通过这个时间戳同步该时间戳以后 ...
- 【转】Go Channels
转自: http://kdf5000.com/2017/07/16/Go-Channels/ Golang使用Groutine和channels实现了CSP(Communicating Sequent ...
- JavaScript实现本地图片上传预览功能(兼容IE、chrome、FF)
需要解决的问题有:本地图片如何在上传前预览.编辑:最近发现这个功能很多是基于flash实现的,很多JavaScript实现的代码兼容性都很差,特别是在IE和firefox和chrome三个浏览器上不兼 ...
- java框架---->quartz整合spring(一)
今天我们学习一下quartz的定时器的使用.年轻时我们放弃,以为那只是一段感情,后来才知道,那其实是一生. quartz的简单实例 测试的项目结构如下: 一.pom.xml中定义quartz的依赖 & ...
- 学习Ruby你需要了解的相关知识(rvm, gem, bundle, rake, rails等)
这篇文章主要介绍了学习Ruby你需要了解的相关知识(rvm, gem, bundle, rake, rails等),需要的朋友可以参考下 Ruby 这个就不用多说了 RVM 用于帮你安装Rub ...
- Sass-学习笔记【进阶篇】
特别说明: 没有sass基础请移步:[Sass-学习笔记[基础篇]]http://www.cnblogs.com/padding1015/articles/7056323.html 最底部附结构图(实 ...
- Vue如何引入远程JS文件
直接在dom上操作: export default { mounted() { const s = document.createElement('script'); s.type = 'text/j ...