python 操作word文档
因为工作需要操作一些word文档,记录一下学习思路
#-*- encoding: utf8 -*- import win32com from win32com.client import Dispatch, constants import win32com.client import __main__ import os import new import sys import re import string reload(sys) sys.setdefaultencoding('utf8') #from fileinput import filename class Word(object): #初始化word对象 def __init__(self, uri): self.objectword(uri) #创建word对象 def objectword(self,url): self.word = win32com.client.Dispatch('Word.Application') self.word.Visible = 0 self.word.DisplayAlerts = 0 self.docx = self.word.Documents.Open(url) self.wrange = self.docx.Range(0, 0) #关闭word def close(self): self.word.Documents.Close() self.word.Quit() #创建word def create(self): pass #在word中进行查找 def findword(self, key): question = [] uri = r'E:\XE\ctb.docx' self.objectword(uri) #读取所有的word文档内容 range = self.docx.Range(self.docx.Content.Start,self.docx.Content.End) question = str(range).split("&") #查找内容 #question = re.split(r"(\r[1][0-9][0-9]+.)",str(range)) #l = question[0].split("\d+.") for questionLine in question: questionLine = questionLine.strip('\n') l = re.split(r"([1][0-9][0-9]+.)",questionLine) del l[0] for t in l: s = str(key[0:3]) if str(t).find(s) > -1: #插入 g = string.join(l) print g.encode('gb2312') #print g.decode("") self.insertword(g) print "sss" else: print "ttt" #插入word def insertword(self,w): url = r'E:\XE\ctb.doc' self.objectword(url) self.wrange.InsertAfter(w) pass #读取数据源 def source(self, src): f = open(src) d = f.readlines() for l in d: name, question01, question02, question03, question04, question05 = tuple(l.decode('utf8').split('\t')) if question01 != u'全对': #self.wrange.InsertAfter(name) self.findword(question01) return self Word(r'E:\XE\xx.docx').source(r'E:\XE\xe.txt').close()
python 操作word文档的更多相关文章
- 利用Python操作Word文档【图片】
利用Python操作Word文档
- python操作docx文档(转)
python操作docx文档 关于python操作docx格式文档,我用到了两个python包,一个便是python-docx包,另一个便是python-docx-template;,同时我也用到了很 ...
- Python之word文档替换字符串(也可以用于短模板套用)
Python之word文档替换字符串(也可以用于短模板套用),代码如下: 1 ''' 2 #word模板套用1:创建模板,适合比较短的文档 3 ''' 4 5 #导入所需库 6 from docx i ...
- iText操作word文档总结
操作word文档的工具有很多,除了iText之外还有POI,但是POI擅长的功能是操作excel,虽然也可以操作word,但是能力有限,而且还有很多的bug,技术并不成熟,下面就重点介绍一种操作wor ...
- C#操作Word文档(加密、解密、对应书签插入分页符)
原文:C#操作Word文档(加密.解密.对应书签插入分页符) 最近做一个项目,客户要求对已经生成好的RTF文件中的内容进行分页显示,由于之前对这方面没有什么了解,后来在网上也找了相关的资料,并结合自己 ...
- Java文件操作系列[3]——使用jacob操作word文档
Java对word文档的操作需要通过第三方组件实现,例如jacob.iText.POI和java2word等.jacob组件的功能最强大,可以操作word,Excel等格式的文件.该组件调用的的是操作 ...
- 使用Python操作Excel文档(一)
Python | 使用Python操作Excel文档(一) 0 前言 在阅读本文之前,请确保您已满足或可能满足以下条件: 请确保您具备基本的Python编程能力. 请确保您会使用Excel. 请确保您 ...
- Python之word文档模板套用 - 真正的模板格式套用
Python之word文档模板套用: 1 ''' 2 #word模板套用2:套用模板 3 ''' 4 5 #导入所需库 6 from docx import Document 7 ''' 8 #另存w ...
- Python读取word文档内容
1,利用python读取纯文字的word文档,读取段落和段落里的文字. 先读取段落,代码如下: 1 ''' 2 #利用python读取word文档,先读取段落 3 ''' 4 #导入所需库 5 fro ...
随机推荐
- linux 从命令行自动识别文件并将其打开的命令
若是shell是 zsh,则可: 使用 alias -s 定义后缀别名 (zsh) % alias -s pl=perl % script.pl perl script.pl % alias -s p ...
- 第三百零八至三百二十天 how can I 坚持
十三天..2月4号至2月16号,好快,假期还没开始就结束了.一一回忆下. 2月4号,腊月二十六,最后一天上班,没多大事,好像是玩了一天,东月回家,貌似路上好折腾,晚上D401,和她聊了一路,也聊了好多 ...
- 第二百三十五天 how can I 坚持
其实昨天听遗憾的,尽头看了新闻,有好多人都出去赏雪了,可惜了,最遗憾的是没有叫上你一块去. 晚上喝了点酒,抽了两根烟,以前基本不喝酒,就别提抽烟了,陈小春的<算你狠>,该如何是好. 经常在 ...
- C#判断当前操作系统
private OperatingSystem os = System.Environment.OSVersion; os.Version.Major.ToString(); ) { //Win7系统 ...
- AJAX的工作原理及其优缺点
1.什么是AJAX?AJAX全称为“Asynchronous JavaScript and XML”(异步JavaScript和XML),是一种创建交互式网页应用的网页开发技术.它使用:使用XHTML ...
- test是否被执行?
procedure TForm2.Button1Click(Sender: TObject); function test(value:boolean):boolean; begin res ...
- 用html5的canvas生成图片并保存到本地
原文:http://www.2cto.com/kf/201209/156169.html 前端的代码: [javascript] function drawArrow(angle) { ...
- 微信分享朋友圈监听(PHP)
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...
- (3)HTML ”列表“、图片和超链接
本节解说 1. html支持的列表:无序列表.有序列表.定义列表 2. html中如何插入图片 3.html的超链接 <1> 无序列表 无序列表是一个项目的列表,此列项目使用粗体圆点(典型 ...
- Trapping Messages Sent to an Application
http://www.delphicorner.f9.co.uk/articles/apps7.htm Trapping Messages Sent to an Application I wrote ...