参考了 http://blog.csdn.net/qq_34475777/article/details/62055523   http://www.cnblogs.com/deepwaterplan/articles/6664796.html

conda安装 pip install python_docx 否则from docx import Document找不到Document
#coding:utf-8

import os
import win32com
from win32com.client import Dispatch, constants
from docx import Document def parse_docx(f):
d = Document(f)
t0 = d.tables[0]
# t1 = d.tables[1]
# t2 = d.tables[2]
# t_next=d.tables[1]
#title= t.cell(0,1).text//比如说标题在表格中位于(0,1)
name = t0.cell(1,1).text
print name if __name__ == "__main__":
w = win32com.client.Dispatch('Word.Application')
parse_docx('E:\\2.docx') 有个问题:想直接读取doc 没法实现 只好把doc转成docx再读取(http://www.cnblogs.com/hanxing/p/7018617.html) doc可以直接读取了 可是结果并如docx读取的好还是用docx的方法好一些
# -*- coding: utf-8 -*-
import win32com,re
from win32com.client import Dispatch,constants word = win32com.client.Dispatch('word.application')
doc = word.Documents.Open('E:\\final.doc') t=doc.Tables[0]
print(type(t))
tt = str(t)
strs=tt.split('')
print(strs[5])
print strs doc.Close()
word.Quit()

结果:

<type 'instance'>
11
['00\r', '01\r', '02\r', '\r', '10\r', '11\r', '12\r', '\r', '20\r', '21\r', '22\r', '\r', '\r', '\r', '\r', '\r', '\r', '\r', '\r', '\r', '']

上面的结果不好判断 还是用docx读取更好一些


下面是读取docx的一个表格的值(doc转docx) 然后替换另外一个模板文件(doc)中的标签的值(biaoqian)最后另存成final
#coding:utf-8
import win32com
from win32com.client import Dispatch
from docx import Document def parse_docx(f):
d = Document(f)
t0 = d.tables[0]
name = t0.cell(1, 1).text
return name if __name__ == "__main__":
w = win32com.client.Dispatch('Word.Application')
va = parse_docx('E:\\1.docx')
filename2 = "E:\\2.doc"
doc = w.Documents.Open(FileName=filename2)
w.Selection.Find.ClearFormatting()
w.Selection.Find.Replacement.ClearFormatting()
w.Selection.Find.Execute("biqoqian", False, False, False, False, False, True, 1, True, va, 2)
doc.SaveAs ('E:\\' + str ("final") + '.doc') # 另存成另一个表
doc.Close ()

读取docx表格中的信息的更多相关文章

  1. 读取Excel表格中数据原型

    写下这篇博客来记录自己的工作,这部分功能是读取Excel表格中的数据,并通过c#中的datagridview控件将读取的数据显示出来.为了方便用户,我设计了一个read按钮,用户点击这个按钮,会弹出打 ...

  2. 利用java反射机制实现读取excel表格中的数据

    如果直接把excel表格中的数据导入数据库,首先应该将excel中的数据读取出来. 为了实现代码重用,所以使用了Object,而最终的结果是要获取一个list如List<User>.Lis ...

  3. Java 读取Word表格中的文本和图片

    本文通过Java程序来展示如何读取Word表格,包括读取表格中的文本和图片.下面是具体实现的步骤和方法. 1. 程序环境准备 代码编译工具:IntelliJ IDEA Jdk版本:1.8.0 测试文档 ...

  4. C#读取Excel表格中数据并返回datatable

    在软件开发的过程中,经常用到从excel表格中读取数据作为数据源,以下整理了一个有效的读取excel表格的方法. DataTable GetDataTable(string tableName,str ...

  5. python读取excel表格中的数据

    使用python语言实现Excel 表格中的数据读取,需要用到xlrd.py模块,实现程序如下: import xlrd #导入xlrd模块 class ExcelData(): def __init ...

  6. java读取Excel表格中的数据

    1.需求 用java代码读取hello.xls表格中的数据 2.hello.xls表格 3.java代码 package com.test; import java.io.File; import j ...

  7. php 读取excel表格中的内容

    <?php /** * excel表格内容在网页中显示 * * 首先需要下载PHPExcel 工具包 * 网址: http://phpexcel.codeplex.com/releases/vi ...

  8. java用poi读取Excel表格中的数据

    Java读写Excel的包是Apache POI(项目地址:http://poi.apache.org/),因此需要先获取POI的jar包,本实验使用的是POI 3.9稳定版.Apache POI 代 ...

  9. Unity 3D读取Excel表格、导入信息、导出Json

    Unity 3D读取/导入Excel表格 本文提供全流程,中文翻译. Chinar 坚持将简单的生活方式,带给世人!(拥有更好的阅读体验 -- 高分辨率用户请根据需求调整网页缩放比例) Chinar ...

随机推荐

  1. 小程序中data数据的处理方法总结

    wxml代码: <view class="container"> <view wx:for="{{list}}" wx:key="t ...

  2. 用Hyper-v 在win10下使用Docker-Desktop体验kubernetes

    首先开启Hyper-v ,会自动创建一个交换机. 开启internet共享,自动创建的那个交换机(虚拟的网络适配器)会分配一个默认的IP 192.168.137.1,这个IP你不爽,就用注册表搜索并修 ...

  3. Python 之网络编程之进程总体概要

     一: 进程的概念:(Process) 进程就是正在运行的程序,它是操作系统中,资源分配的最小单位. 资源分配:分配的是cpu和内存等物理资源 进程号是进程的唯一标识 同一个程序执行两次之后是两个进程 ...

  4. Centos7 iptables firewalld防火墙与selinux配置

    一.iptables防火墙 1.基本操作 # 查看防火墙状态 service iptables status # 停止防火墙 service iptables stop # 启动防火墙 service ...

  5. JS实现深拷贝,浅拷贝的方法

    在 JS 中,函数和对象都是浅拷贝(地址引用):其他的,例如布尔值.数字等基础数据类型都是深拷贝(值引用). 深拷贝 JSON.parse(JSON.stringify(src)):这种方法有局限性, ...

  6. python面向对象之元类

    目录 元类 造类 第一阶段 第二阶段 造对象 元类 元类(A) ---> 类(B) ---> 实例(C) 对于实例C而言,它是对象,它的类就是类B 对于类B而言,它其实也是对象,那它的类就 ...

  7. C# Connection:连接数据库---转载

    C# 语言中 Connection 类是 ADO.NET 组件连接数据库时第一个要使用的类,也是通过编程访问数据库的第一步. 接下来我们来了解一下 Connection 类中的常用属性和方法,以及如何 ...

  8. three.js的一些介绍

    什么是 WebGL? WebGL(Web 图形库)是一种 JavaScript API,用于在任何兼容的 Web 浏览器中呈现交互式 3D 和 2D 图形,而无需使用插件.WebGL 通过引入一个与 ...

  9. CSS相关(1)

    CSS: 字体: 网页默认字体16px; 网站通用字体大小14px 最小是12px,最大无限大 单位换算:1em=16px 选择器:标签选择器:选择页面中所有指定标签,权重为1 通配符选择器:选择所有 ...

  10. CXL联盟正式成立:成员均是行业巨头

    导读 今天,阿里巴巴.思科.戴尔EMC.Facebook.Google.HPE.华为.Intel.微软(按英文首字母排序)联合宣布,CXL联盟(Compute Express Link Consort ...