Python解析excel文件并存入sqlite数据库

最近由于工作上的需求需要使用Python解析excel文件并存入sqlite 就此做个总结
功能：
1.数据库设计建立数据库
2.Python解析excel文件
3.Python读取文件名并解析
4.将解析的数据存储入库

一建立数据库

根据需求建立数据库,建立了两个表，并保证了可以将数据存储到已有的数据库中，代码如下：

import sqlite3

def createDataBase():

cn = sqlite3.connect('check.db')

cn.execute('''CREATE TABLE IF NOT EXISTS TB_CHECK

(ID integer PRIMARY KEY AUTOINCREMENT,

NUMBER INTEGER,

ITEM TEXT,

REFERENCE TEXT,

SUMMARY TEXT,

OBJECT TEXT,

METHOD TEXT,

CONDITION TEXT,

VALUE TEXT,

RESULT TEXT,

SCORE TEXT,

REMARKS TEXT,

PROVINCE TEXT,

TIME TEXT);''')

cn.execute('''CREATE TABLE IF NOT EXISTS TB_SCORE

(ID integer PRIMARY KEY AUTOINCREMENT,

PROVINCE TEXT,

TIME TEXT,

FILETYPE TEXT,

SCORE INTEGER);''')

if __name__ == '__main__':

createDataBase()

二使用Python解析excel

Python中的xlrd模块用来解析excel。相关功能介绍如下：
1. 导入
import xlrd
2. 读取数据
data = xlrd.open_workbook('file.xls')
3. 功能
（1）通过索引获取
table = data.sheet()[0]
table = data.sheet_by_index(0)
（2）通过名称获取
table = data.sheet_by_name(u'sheet1')
（3）获取整行和整列的值（数组)
table.row_values(i)
table.col_values(i)
（4）获取行数和列数
nrows = table.nrows
ncols = table.ncols
（5）循环行列表数据
for i in range(nrows):
print table.row_values(i)
（6）单元格
cell_A1 = table.cell(0,0).value
（7）使用行列索引
cell_A1 = table.cell(0,0).value

练习代码：

import xlrd

import xlwt

from datetime import date,datetime

def read_excel():

# 打开文件

workbook = xlrd.open_workbook(r'file.xls')

# 获取所有sheet

sheet_name = workbook.sheet_names()[0]

sheet = workbook.sheet_by_name(sheet_name)

#获取一行的内容

for i in range(6,sheet.nrows):

for j in range(0,sheet.ncols):

print sheet.cell(i,j).value.encode('utf-8')

if __name__ == '__main__':

read_excel()

三 Python读取文件名并解析

为了将各个文件的数据加以区分，需要将文件名中标志性字段入库，解析文件的代码如下：

import os

def getFileList(dir,wildcard,recursion):

    os.chdir(dir)

    fileList = []

    check_province = []

    check_time = []

    file_type = []

    exts = wildcard.split(" ")

    files = os.listdir(dir)

    for name in files:

        fullname=os.path.join(dir,name)

        if(os.path.isdir(fullname) & recursion):

            getFileList(fullname,wildcard,recursion)

        else:

            for ext in exts:

                if(name.endswith(ext)):

                    fileList.append(name)

                    check_province.append(name.split('-')[1])

                    check_time.append(name.split('-')[0])

                    file_type.append(name.split('-')[2])

    return fileList,check_time,check_province,file_type

在接下来的使用中会遇到编码问题所以在使用这些字段时需要先转码，编写转码函数如下：

#转码函数
def changeCode(name):
　　name = name.decode('GBK')
　　name = name.encode('UTF-8')
　　return name

四解析excel文件并将其存储到sqlite
　　Python连接数据库选取了Python自带的sqlite数据库相对简单在此不做太多介绍如果大家对Python操作sqlite有疑惑的话个人推荐菜鸟教程～

　　下面是解析excel文件并存入数据库,其中包含了判断单元格内容：

def readExcel(filename,cn,check_province,check_time,FileType):

  #读取

  workbook = xlrd.open_workbook(filename)

  # 获取sheet

  sheet_name = workbook.sheet_names()[0]

  　　sheet = workbook.sheet_by_name(sheet_name)

  check_Item = 'a'

  itemCount = 0

  score = 0

  second = sheet.cell(7,1).value.encode('utf-8')

  for i in range(7,sheet.nrows):

      if sheet.cell(i,1).value.encode('utf-8') == second:

          check_Item = sheet.cell(i,0).value.encode('utf-8')

          continue

      temp = []

      for j in range(0,sheet.ncols):

          temp.append(sheet.cell(i,j).value.encode('utf-8'))

      answer = sheet.cell(i,7).value.encode('utf-8')

      if answer == "yes" or answer == "no":

          score = score + 1

      if answer == "other":

          print "!!!Failed to import'%s'" % (filename)

          print "!!!Please Choose an Right Answer for '%s'--------"%(filename)

          break

      else:

          cn.execute("insert into TB_CHECK (ITEM,FIELD,TYPE,CONTENT,"

                     "ATTRIBUTE,CHECKPOINT,REMARKS,ANSWER,DESCRIPTION,"

                     "SUGGESTION,PROVINCE,TIME,STYLE) "

                     "values('%s','%s','%s','%s','%s','%s','%s','%s','%s','%s','%s','%s','%s')"

                     ""%(temp[0],temp[1],temp[2],temp[3],temp[4],temp[5],temp[6],temp[7],temp[8],temp[9],check_province,check_time,check_Item))

          itemCount = itemCount + 1

  if itemCount != 0:

      score = round(score * (100 / itemCount), 2)

      cn.execute("insert into TB_SCORE (PROVINCE,TIME,FILETYPE,SCORE) "

             "values('%s','%s','%s','%.2f')"%(check_province,check_time,FileType,score))

      print "Successful for'%s'--------" % (filename)

  cn.commit()

　　
整合上述功能：

def importData(path):

    # 数据库

    createDataBase()

    database = sqlite3.connect("check.db")

    #文件类型

    wildcard = ".xls"

    list = getFileList(path,wildcard,1)

    nfiles = len(list[0])

    #文件名

    file = list[0]

    #时间

    time = list[1]

    #省份

    province = list[2]

    # #文件类型

    FileType = list[3]

    for count in range(0,nfiles):

        filename = file[count]

        check_province = changeCode(province[count])

        check_time = time[count]

        File_type = changeCode(FileType[count])

        readExcel(filename,database,check_province,check_time,File_type)

if __name__ == '__main__':

    if len(sys.argv) != 2:

        print "Wrong Parameters"

    else:

        path = sys.argv[1]

        importData(path)

这就是解析excel文件并存入sqlite的主要代码
完整代码见：https://github.com/Ben0825/Python

Python解析excel文件并存入sqlite数据库的更多相关文章

vue下载和上传excle数据文件，解析excel文件数据并存在数据库中
下载: VUE: window.open("xxxx/downloadOldTaskDataFile.do_", "_blank"); JAVA: /** * ...
解析Excel文件并把数据存入数据库
前段时间做一个小项目,为了同时存储多条数据,其中有一个功能是解析Excel并把其中的数据存入对应数据库中.花了两天时间,不过一天多是因为用了"upload"关键字作为URL从而导致 ...
python 解析Excel
python 解析Excel 公司背景:好吧LZ太懒了.略... 原由起因:公司老板发话要导出公司数据库中符合条件的数据,源数据有400万,符合条件的大概有70万左右吧. 最终目的:符合条件的数据并生 ...
NodeJs之EXCEL文件导入导出MongoDB数据库数据
NodeJs之EXCEL文件导入导出MongoDB数据库数据一,介绍与需求 1.1,介绍 (1),node-xlsx : 基于Node.js解析excel文件数据及生成excel文件. (2),ex ...
Java通过jxl解析Excel文件入库，及日期格式处理方式（附源代码）
JAVA可以利用jxl简单快速的读取文件的内容,但是由于版本限制,只能读取97-03 xls格式的Excel. 本文是项目中用到的一个实例,先通过上传xls文件(包含日期),再通过jxl进行读取上传 ...
自动化测试如何解析excel文件？
前言自动化测试中我们存放数据无非是使用文件或者数据库,那么文件可以是csv,xlsx,xml,甚至是txt文件,通常excel文件往往是我们的首选,无论是编写测试用例还是存放测试数据,excel都是 ...
[转]用Python读写Excel文件
[转]用Python读写Excel文件转自:http://www.gocalf.com/blog/python-read-write-excel.html#xlrd-xlwt 虽然天天跟数据打交 ...
Java：JXL解析Excel文件
项目中,有需求要使用JXL解析Excel文件. 解析Excel文件我们先要将文件转化为数据流inputStream. 当inputStream很大的时候会造成Java虚拟器内存不够抛出内存溢出 ...
c++ 读取并解析excel文件方法
用Cocos开发模型特效工具编辑器,跨Mac和windows,当中有个需求是读取并解析excel文件,但网上的查找的例子几乎都只能是在windows下面使用,再或者是命令行脚本之类的.于是,自己写了一 ...

随机推荐

HDU - 6395 Sequence (分块+快速矩阵幂)
给定递推式: 求Fn. 分析:给出的公式可以用快速矩阵幂运算得到,但 P/n 整除对于不同的i,值是不同的. 可以根据P将3-n分成若干块,每块中P整除n的值是相同的.分块的时候要注意判断. 将每块的 ...
Asp.Net中OnClientClick与OnClick的区别
当我们当击这个按钮时,自动先执行的客户端,再执行服务器端的.如果客户端返回的是false,那么服务器端对应的方法永远不会执行.这样就达到检测,只有通过才去执行服务器端的方法.
单元测试框架unittest，ddt
unittest case.py 测试用例 suite.py 测试套件 loader.py 加载测试用例 run.py 执行测试用例 result.py 测试结果,测试报告 main mock 模拟测 ...
iOS开发小结 - 让你的APP后台运行
最近项目有个需求需要让app在后台一直运行计时着,找了一些资料,只能用比较无耻的做法了,播放一段没有声音的音频文件,这样你的APP就不会被系统杀掉~~ 我们只需要用到<AVFoundation/ ...
在 CentOS 7.0 上安装配置 Ceph 存储
来自: https://linux.cn/article-6624-1.html Ceph 是一个将数据存储在单一分布式计算机集群上的开源软件平台.当你计划构建一个云时,你首先需要决定如何实现你的存储 ...
SMM+maven下的log4j配置打印sql
1加入依赖包  <dependency> <groupId>org.slf4j</groupId> <ar ...
制作基于Buildbot的自动化测试系统Docker镜像
Buildbot in Docker 前言最近使用Buildbot做了一个自动测试的框架,为了部署方便,可以把测试框架做成Docker镜像,方便部署.这里记录下过程,供大家参考. 项目介绍项目是一 ...
JavaScript字符串转换为变量名
1.将一个字符串转换为变量名 [javascript] view plain copy print? function string_to_name(string){ let _name = 'var ...
Codeforces Round #365 (Div. 2) D.Mishka and Interesting sum 树状数组+离线
D. Mishka and Interesting sum time limit per test 3.5 seconds memory limit per test 256 megabytes in ...
SQL优化之列裁剪和投影消除
列裁剪对于没用到的列,则没有必要读取它们的数据去浪费无谓的IO 比如我们有一张表table1,它含有四列数据(a,b,c,d).当我们执行查询select a from table1 where c ...

Python解析excel文件并存入sqlite数据库

Python解析excel文件并存入sqlite数据库的更多相关文章

随机推荐

热门专题