原创:

qq:231469242

import xlrd
import pandas,numpy
import matplotlib.pyplot as plt
import pandas as pd
 
#参数
#报告时间
reportdate="2016/12/22"
#省份
admin="江西"
fileName="江西2016年第4期药品质量公告不符合规定药品汇总(假冒).xls"
year="2016年"
#文件名
file="江西2016年第4期药品质量公告不符合规定药品汇总"
url="http://www.jxda.gov.cn/ZWGK/ZWTG/ZLGG/2016/12/14761230.html"
#假冒设置为空值
fake=""
 
data = xlrd.open_workbook(fileName)
 
table = data.sheets()[0]
 
#获取行数和列数
nrows = table.nrows
ncols = table.ncols
 
 
#把excel数据转换为列为元素的列表
list_columns=[]
 
#A类,存储标签包含的关键字
#存储药品名称相关中文
list_title_names=['药品名称','检品名称','药品品名','品名','样品名称','标示药品名称']
#存储标示生产企业相关中文
list_title_manufacturers=['标示生产单位','标示生产企业','样品标示生产单位','标示生产企业名称']
#存储药标示批号相关中文
list_title_pitchnos=['标示批号','批号','生产批号','批件号','产品批号']
#存储药标示批号相关中文
list_title_specifications=['标示规格','规格','药品规格']
#存储不合格项目相关中文
list_title_unpasseditems=['不符合项目','不合格项目','不符合规定项目']
#存储有效期相关中文
list_title_validperiods=['有效期至']
#存储来源相关中文
list_title_sources=['检品来源','来源','供样单位','申报单位','被抽样单位','被抽验单位','被抽样单位名称']
#存储检验单位相关中文
list_title_testoffices=['检验单位','检验机构']
#存储检验物质相关中文
list_title_testobjectives=['检验物质']
#存储检验依据相关中文
list_title_regulations=['检验依据']
#存储备注相关中文
list_title_notices=['备注']
 
 
#B类,存储列信息
list_name=[]
list_manufacturer=[]
list_pichno=[]
list_specification=[]
list_unpasseditem=[]
list_validperiod=[]
list_reportdate=[]
list_source=[]
list_testoffice=[]
list_testobjective=[]
list_regulation=[]
list_year=[]
list_file=[]
list_url=[]
list_notice=[]
list_fake=[]
 
#把excel数据转换为列为元素的列表 函数
def List_columns(table,ncols):
    for i in range(ncols):
        list1=table.col_values(i)
        list_columns.append(list1)
    return list_columns
     
 
 
#获取list_columnInformation数据
#list_columns是把excel数据转换为列为元素的列表
#list_title存储列标签信息,例如list_title_unpasseditems
#list_columnInformation表示搜索到的相关列信息,例如list_names
def List_columnInformation(list_columns,list_title_names,list_columnInformation):
    for i in range(len(list_columns)):
        #获取列数据
        list_column=list_columns[i]
        #title表示标题,例如产品名字
        title=list_column[0]
        #字段名去除空格
        title1=title.replace(" ","")
        #print("title:",title)
        if title1 in list_title_names:
            #print("find title")
            list_columnInformation=list_column[1:]
            return list_columnInformation
        else:
            list_columnInformation=['']*(nrows-1)
    return list_columnInformation
 
        
     
     
#用于获取报告时间,网址,文件名等列信息   
def List_repeat_columnInformation(nrows,value):
    list_repeat_columnInformation=[value]*(nrows-1)
 
    return list_repeat_columnInformation
     
#获取各列数据
list_columns=List_columns(table,ncols)
list_name=List_columnInformation(list_columns,list_title_names,list_name)
list_manufacturer=List_columnInformation(list_columns,list_title_manufacturers,list_manufacturer)
list_pichno=List_columnInformation(list_columns,list_title_pitchnos,list_pichno)
list_specification=List_columnInformation(list_columns,list_title_specifications,list_specification)
list_unpasseditem=List_columnInformation(list_columns,list_title_unpasseditems,list_unpasseditem)
list_validperiod=List_columnInformation(list_columns,list_title_validperiods,list_validperiod)
list_reportdate=List_repeat_columnInformation(nrows,reportdate)
list_source=List_columnInformation(list_columns,list_title_sources,list_source)
list_testoffice=List_columnInformation(list_columns,list_title_testoffices,list_testoffice)
list_testobjective=List_columnInformation(list_columns,list_title_testobjectives,list_testobjective)
list_regulation=List_columnInformation(list_columns,list_title_regulations,list_regulation)
list_adminadd=List_repeat_columnInformation(nrows,admin)
list_year=List_repeat_columnInformation(nrows,year)
list_file=List_repeat_columnInformation(nrows,file)
list_url=List_repeat_columnInformation(nrows,url)
list_notice=List_columnInformation(list_columns,list_title_notices,list_notice)
list_fake=List_repeat_columnInformation(nrows,'')
 
#pandas字典写入excel会有标题排序问题,所以用a,b,c等顺序字母代替
data=pd.DataFrame({'a':list_name,'b':list_manufacturer,
                   'c':list_pichno,'d':list_specification,
                   'e':list_unpasseditem,'f':list_validperiod,
                   'g':list_reportdate,'h':list_source,
                   'i':list_testoffice,
                   'j':list_testobjective,
                   'k':list_regulation,'l':list_adminadd,
                   'm':list_year,'n':list_file,'o':list_url,
                   'p':list_notice,'q':list_fake})
                    
                    
data.to_excel("ypzl_normal.xlsx")

ypzl药品质量不合格数据库-excel自动排版的更多相关文章

  1. 大手册(书籍)排版利器-XML自动排版生成工具

    --支持全球化/多语言/符合W3C标准的XML自动排版工具 Boxth XML/XSL Formatter是专为XML数据或其他结构化数据源自动输出排版文件(如: PDF等)而设计的集数据格式化.版式 ...

  2. 自动排版工具——XML自动排版生成工具

    ——支持全球化/多语言/符合W3C标准的XML自动排版工具 Boxth XML/XSL Formatter是专为XML数据或其他结构化数据源自动输出排版文件(如: PDF等)而设计的集数据格式化.版式 ...

  3. SQL Server数据库定时自动备份

    SQL Server 数据库定时自动备份[转]   在SQL Server中出于数据安全的考虑,所以需要定期的备份数据库.而备份数据库一般又是在凌晨时间基本没有数据库操作的时候进行,所以我们不可能要求 ...

  4. eclipse自动排版JSP问题

    eclipse自动排版JSP非常难看,标签每行显示不完整,开发时很难受,下面设置一下这个就好多了: window-->preferences-->Web-->HTML Files-- ...

  5. eclipse 自动排版

    自动排版:  ctrl + i 同名变量高亮: shift+alt+ o 导包:  shift+ctrl +o

  6. Hibernate连接mysql数据库并自动创建表

    天才第一步,雀氏纸尿裤,Hibernate第一步,连接数据库. Hibernate是一个开放源代码的对象关系映射框架,它对JDBC进行了非常轻量级的对象封装,它将POJO与数据库表建立映射关系,是一个 ...

  7. Windows环境下Oracle数据库的自动备份脚本

    批处理文件(.bat) @echo off echo ================================================ echo  Windows环境下Oracle数据 ...

  8. myeclipse自动排版

    myeclipse代码排版方式有两种: 1. ctr+f 实现自动排版: 2. myeclipse->Preference->Java->Editor->Sava Action ...

  9. 使用SQL Server维护计划实现数据库定时自动备份

    在SQL Server中出于数据安全的考虑,所以需要定期的备份数据库.而备份数据库一般又是在凌晨时间基本没有数据库操作的时候进行,所以我们不可能要求管理员每天守到晚上1点去备份数据库.要实现数据库的定 ...

随机推荐

  1. MongoDB学习笔记~为IMongoRepository接口添加了增删改方法,针对官方驱动

    回到目录 上一讲说了MongoDB官方驱动的查询功能,这回说一下官方驱动的增删改功能,驱动在升级为2.0后,相应的insert,update和delete都只有了异步版本(或者叫并行版本),这当然也是 ...

  2. 大型web系统数据缓存设计

    1. 前言 在高访问量的web系统中,缓存几乎是离不开的:但是一个适当.高效的缓存方案设计却并不容易:所以接下来将讨论一下应用系统缓存的设计方面应该注意哪些东西,包括缓存的选型.常见缓存系统的特点和数 ...

  3. 关于oracle中数据类型的选择

    由于是初学,犯了如下错误: 生成表的主键id时,用当前时间的毫秒值.而在oracle中定义主键id时,用的数据类型是char(32).在mybatis中通过id取数据怎么也取不出来.想了好几天,本来以 ...

  4. [经验]Textbox 做日志记录,

    private void Log(string msg) { txtLog.MaxLength = ; txtLog.AppendText(msg); } 起因:在Winform中用Textbox显示 ...

  5. java强引用、软引用、弱引用、虚引用

    前言概述 在JDK1.2以前的版本中,当一个对象不被任何变量引用,那么程序就无法再使用这个对象.这就像在日常生活中,从商店购买了某样物品后,如果有用,就一直保留它,否则就把它扔到垃圾箱,由清洁工人收走 ...

  6. diff/merge configuration in Team Foundation - common Command and Argument values - MSDN Blogs

    One of the extensibility points we have in Team Foundation V1 is that you can configure any other di ...

  7. Java读带有BOM的UTF-8文件乱码原因及解决方法

    原因: 关于utf-8编码的txt文件,windows以记事本方式保存时会在第一行最开始处自动加入bom格式的相关信息,大概三个字节! 所以java在读取此类文件时第一行时会多出三个不相关的字节,这样 ...

  8. tomcat和HTTP

    tomcat和HTTP 1.tomcat的关闭和启动 启动:sudo /opt/tomcat/bin/startup.sh 关闭:sudo /opt/tomcat/bin/shutdown.sh 2. ...

  9. nvl函数 oracle

    Oracle中函数以前介绍的字符串处理,日期函数,数学函数,以及转换函数等等,还有一类函数是通用函数.主要有:NVL,NVL2,NULLIF,COALESCE,这几个函数用在各个类型上都可以. 下面简 ...

  10. python-网络编程-socket编程

    一.TCP\IP(网络通信协议)简介       TCP:(Transmission Control Protocol)传输控制协议,面向有连接的通信协议  UDP:数据报文协议,面向无连接的通信协议 ...