读取docx表格中的信息
参考了 http://blog.csdn.net/qq_34475777/article/details/62055523 http://www.cnblogs.com/deepwaterplan/articles/6664796.html conda安装 pip install python_docx 否则from docx import Document找不到Document
#coding:utf-8 import os
import win32com
from win32com.client import Dispatch, constants
from docx import Document def parse_docx(f):
d = Document(f)
t0 = d.tables[0]
# t1 = d.tables[1]
# t2 = d.tables[2]
# t_next=d.tables[1]
#title= t.cell(0,1).text//比如说标题在表格中位于(0,1)
name = t0.cell(1,1).text
print name if __name__ == "__main__":
w = win32com.client.Dispatch('Word.Application')
parse_docx('E:\\2.docx') 有个问题:想直接读取doc 没法实现 只好把doc转成docx再读取(http://www.cnblogs.com/hanxing/p/7018617.html) doc可以直接读取了 可是结果并如docx读取的好还是用docx的方法好一些
# -*- coding: utf-8 -*-
import win32com,re
from win32com.client import Dispatch,constants word = win32com.client.Dispatch('word.application')
doc = word.Documents.Open('E:\\final.doc') t=doc.Tables[0]
print(type(t))
tt = str(t)
strs=tt.split('')
print(strs[5])
print strs doc.Close()
word.Quit()
结果:
<type 'instance'>
11
['00\r', '01\r', '02\r', '\r', '10\r', '11\r', '12\r', '\r', '20\r', '21\r', '22\r', '\r', '\r', '\r', '\r', '\r', '\r', '\r', '\r', '\r', '']
上面的结果不好判断 还是用docx读取更好一些
下面是读取docx的一个表格的值(doc转docx) 然后替换另外一个模板文件(doc)中的标签的值(biaoqian)最后另存成final
#coding:utf-8
import win32com
from win32com.client import Dispatch
from docx import Document def parse_docx(f):
d = Document(f)
t0 = d.tables[0]
name = t0.cell(1, 1).text
return name if __name__ == "__main__":
w = win32com.client.Dispatch('Word.Application')
va = parse_docx('E:\\1.docx')
filename2 = "E:\\2.doc"
doc = w.Documents.Open(FileName=filename2)
w.Selection.Find.ClearFormatting()
w.Selection.Find.Replacement.ClearFormatting()
w.Selection.Find.Execute("biqoqian", False, False, False, False, False, True, 1, True, va, 2)
doc.SaveAs ('E:\\' + str ("final") + '.doc') # 另存成另一个表
doc.Close ()
读取docx表格中的信息的更多相关文章
- 读取Excel表格中数据原型
写下这篇博客来记录自己的工作,这部分功能是读取Excel表格中的数据,并通过c#中的datagridview控件将读取的数据显示出来.为了方便用户,我设计了一个read按钮,用户点击这个按钮,会弹出打 ...
- 利用java反射机制实现读取excel表格中的数据
如果直接把excel表格中的数据导入数据库,首先应该将excel中的数据读取出来. 为了实现代码重用,所以使用了Object,而最终的结果是要获取一个list如List<User>.Lis ...
- Java 读取Word表格中的文本和图片
本文通过Java程序来展示如何读取Word表格,包括读取表格中的文本和图片.下面是具体实现的步骤和方法. 1. 程序环境准备 代码编译工具:IntelliJ IDEA Jdk版本:1.8.0 测试文档 ...
- C#读取Excel表格中数据并返回datatable
在软件开发的过程中,经常用到从excel表格中读取数据作为数据源,以下整理了一个有效的读取excel表格的方法. DataTable GetDataTable(string tableName,str ...
- python读取excel表格中的数据
使用python语言实现Excel 表格中的数据读取,需要用到xlrd.py模块,实现程序如下: import xlrd #导入xlrd模块 class ExcelData(): def __init ...
- java读取Excel表格中的数据
1.需求 用java代码读取hello.xls表格中的数据 2.hello.xls表格 3.java代码 package com.test; import java.io.File; import j ...
- php 读取excel表格中的内容
<?php /** * excel表格内容在网页中显示 * * 首先需要下载PHPExcel 工具包 * 网址: http://phpexcel.codeplex.com/releases/vi ...
- java用poi读取Excel表格中的数据
Java读写Excel的包是Apache POI(项目地址:http://poi.apache.org/),因此需要先获取POI的jar包,本实验使用的是POI 3.9稳定版.Apache POI 代 ...
- Unity 3D读取Excel表格、导入信息、导出Json
Unity 3D读取/导入Excel表格 本文提供全流程,中文翻译. Chinar 坚持将简单的生活方式,带给世人!(拥有更好的阅读体验 -- 高分辨率用户请根据需求调整网页缩放比例) Chinar ...
随机推荐
- 127、Java面向对象之对象的比较
01.代码如下: package TIANPAN; class Book { private String title; private double price; public Book(Strin ...
- 测试人员如何使用Git
测试人员如何使用Git? 首先Git的安装,这里不多做阐述,直接去Git官方网站下载后并傻瓜式安装即可. 如何判定已安装好Git呢? ------------- 随便打开一个目录,鼠标右键点击可看到 ...
- P3919 【模板】可持久化数组 -初步探究主席树
本篇blog主要是给自己(大家)看的. 感谢longlongzhu123奆佬(此人初二LCT)的指点,使本蒟蒻可以快速开始主席树入门. what is 主席树? $ $主席树这个名字只不 ...
- #写一个随机产生138开头手机号的程序 1.输入一个数量,产生xx条手机号 2.产生的这些手机号不能重复
import randomcount=int(input('请输入你所想要手机号数量:'))prefix='138'for i in range(count): num=random.sample(r ...
- 彻底搞懂 JS 中 this 机制
彻底搞懂 JS 中 this 机制 摘要:本文属于原创,欢迎转载,转载请保留出处:https://github.com/jasonGeng88/blog 目录 this 是什么 this 的四种绑定规 ...
- 项目启动异常,java.lang.IllegalStateException: BeanFactory not initialized or already closed - call 'refresh' before accessing beans via the ApplicationContext
java.lang.IllegalStateException: BeanFactory not initialized or already closed - call 'refresh' befo ...
- Ajax--jQuery使用Ajax
1.jQuery对Ajax操作进行了封装,在jQuery最底层的方法是$.ajax(),第二层是 load() , $.get() 和 $.post(),第三层是 $.getScript() 和 $. ...
- IdentityServer4专题之三:OAuth、SSO和OpenID
一.oauth 典型案例:如果一个用户R拥有两项服务:一项服务是图片在线存储服务A,另一个是图片在线打印服务B.由于服务A与服务B是由两家不同的服务提供商提供的,所以用户在这两家服务提供商的网站上各自 ...
- 几种编辑器的markdown-toc生成目录在github上的表现
Vscode vscode的markdown-toc插件的实现是比较好的, 目前发现的问题就只有在自动生成带链接目录的时候无法正确识别和生成一些特殊的字符. 例如: ▶ 这导致在标题中不能加入特殊字符 ...
- 给服务器做pve系统(可以通过web管理物理机集群资源与虚拟机)
做此系统前,可以先进入bios,设置一下ipmi的网络地址.可以远程管理服务器 输入服务器的ipmi里面配置的ip 默认账号与密码admin 点击launch 会自动下载认证文件 下载好java软件环 ...