Django-Import-Export插件控制数据导入流程
前言
之前写过两篇跟这个插件有关的文章,可以回顾一下:
最近有个朋友留言问我一个关于django-import-export插件的问题
为了形象表达这个问题,我举个书籍管理的例子来描述一下
数据库表
id name price 1 book1 10 2 book2 20 3 book3 30 要导入的Excel表
id name price tax 4 book4 40 5 5 book5 50 6 6 book6 60 7 可以看到,Excel里每本书都有价格和税两个属性,但数据库只有价格一个属性
导入的时候,需要把每本书的价格+税,才是要存入数据的最终价格
在以前,这种问题场景我会建议直接用pandas来处理数据然后导入,django-import-export插件只用来做数据导出,因为它的文档很简陋,给的例子很难解决实际问题,往往某个需求用pandas手动处理只需要很少时间,用这个插件还得去啃源码和简陋的文档,效率太低了。
不过本着折腾的精神,还是来研究一下这个用django-import-export到底能不能实现这个功能。(结果当然是可以的,不然也没有这篇文章了)
分析
首先是看官网文档,有一个节点叫import data workflow
地址:https://django-import-export.readthedocs.io/en/latest/import_workflow.html
import_data
(dataset, dry_run=False, raise_errors=False)The
import_data()
method ofResource
is responsible for importing data from a given dataset.
dataset
is required and expected to be atablib.Dataset
with a header row.
dry_run
is a Boolean which determines if changes to the database are made or if the import is only simulated. It defaults toFalse
.
raise_errors
is a Boolean. IfTrue
, import should raise errors. The default isFalse
, which means that eventual errors and traceback will be saved inResult
instance.
根据文档,在导入数据的时候,我们可以通过import_data
这个hook来对要导入的数据进行处理
然后这个hook有个参数,dataset
,这个是tablib的东西
关于这个tablib,我之前没用过,查了一下,是requests作者做的库,那想来应该不会差
官网文档是:https://tablib.readthedocs.io/en/stable/tutorial.html
写代码
直接把官方的代码例子拿来用
代码仓库:https://github.com/django-import-export/django-import-export
同样是这个书籍管理的
Models代码
来看看它的model设计
class Book(models.Model):
name = models.CharField('Book name', max_length=100)
author = models.ForeignKey(Author, blank=True, null=True, on_delete=models.CASCADE)
author_email = models.EmailField('Author email', max_length=75, blank=True)
imported = models.BooleanField(default=False)
published = models.DateField('Published', blank=True, null=True)
published_time = models.TimeField('Time published', blank=True, null=True)
price = models.DecimalField(max_digits=10, decimal_places=2, null=True, blank=True)
added = models.DateTimeField(blank=True, null=True)
categories = models.ManyToManyField(Category, blank=True)
def __str__(self):
return self.name
很多字段
要导入的数据
依然是官方提供的,各种格式都有,我选csv的,比较方便
id,name,author_email
1,Some book,test@example.com
转换成表格长这样
id | name | author_email |
---|---|---|
1 | Some book | test@example.com |
可以看到字段比model定义的少很多
我们要在导入的时候,给dataset加上价格(price)属性
Resources代码
这是原本的代码
class BookResource(ModelResource):
class Meta:
model = Book
def for_delete(self, row, instance):
return self.fields['name'].clean(row) == ''
return super(BookResource, self).import_data(
dataset, dry_run, raise_errors, use_transactions,
collect_failed_rows, rollback_on_validation_errors, **kwargs
现在我们要加一个hook来处理导入的数据
代码如下
def import_data(self, dataset: tablib.Dataset, dry_run=False, raise_errors=False,
use_transactions=None, collect_failed_rows=False,
rollback_on_validation_errors=False, **kwargs):
cols = []
for item in dataset['id']:
cols.append(int(item) * 99)
dataset.append_col(cols, header='price')
print(dataset)
return super(BookResource, self).import_data(
dataset, dry_run, raise_errors, use_transactions,
collect_failed_rows, rollback_on_validation_errors, **kwargs
)
使用DataSet
的append_col
方法来添加一个新的列
关于这个DataSet
的更多操作请参考Tablib的文档
这部分的具体操作可以根据实际需求来做修改,这里我直接简单粗暴的把ID乘以99
处理完DataSet
之后记得要执行父类的import_data
,完成数据导入的操作。
效果
在admin后台执行导入,可以得到以下的结果
可以看到price属性变成99
ID | NAME | AUTHOR | AUTHOR_EMAIL | IMPORTED | PUBLISHED | PUBLISHED_TIME | PRICE | ADDED | CATEGORIES | |
---|---|---|---|---|---|---|---|---|---|---|
New | 1 | Some book | test@example.com | 0 | 99 |
就OK了,搞定~
其实还挺简单的,只是官方文档太简陋了,连个例子的没有,只能自己摸索一下
参考资料
虽然前面都有链接,这里再总结一下吧
- 插件文档:https://django-import-export.readthedocs.io/en/latest/import_workflow.html
- 插件项目主页:https://github.com/django-import-export/django-import-export
- Tablib文档:https://tablib.readthedocs.io/en/stable/tutorial.html
Django-Import-Export插件控制数据导入流程的更多相关文章
- Django import / export实现数据库导入导出
使用django-import-export库,导入导出数据,支持csv.xls.json.html等格式 官网:http://django-import-export.readthedocs.io/ ...
- sqlite3 import/export db sqlite 导入 导出 数据
export: $ sqlite3 xxx.db3 > .output xxx.sql >.dump > .q import: $ sqlite3 xxx.db3 > .rea ...
- [转] ES6 import/export:模块导入导出方式
export导出语法 // default exports export default 42; export default {}; export default []; export defaul ...
- django开发环境搭建(参考流程)
django开发环境搭建(参考流程) 2013-08-08 01:09:06 分类: LINUX 原文地址:django开发环境搭建(参考流程) 作者:bailiangcn 对于一个初学者,在实际的开 ...
- 总账:日记账导入流程(文档 ID 1591640.1)
文档内容 概要 历史记录 详细信息 GL_INTERFACE_CONTROL GL_INTERFACE_HISTORY GL_IMPORT_REFERENCES 摘要 ...
- 前端 高级 (二十五)vue2.0项目实战一 配置简要说明、代码简要说明、Import/Export、轮播和列表例子
一.启动服务自动打开浏览器运行 二.配置简要说明 1.node_modules 安装好的依赖文件,中间件等,所在位置 2.package.jason 配置当前项目要安装的中间件和依赖文件 { &quo ...
- require/exports 与 import/export 的区别?
文章作者:寸志链接:https://www.zhihu.com/question/56820346/answer/150724784来源:知乎 遵循的模块化规范不一样 模块化规范:即为 JavaScr ...
- 探讨ES6的import export default 和CommonJS的require module.exports
今天来扒一扒在node和ES6中的module,主要是为了区分node和ES6中的不同意义,避免概念上的混淆,同时也分享一下,自己在这个坑里获得的心得. 在ES6之前 模块的概念是在ES6发布之前就出 ...
- django admin后台插件:django-suit入门
去年9月底开始用django来做公司内部项目,开始对django有了一些了解,感觉django真的蛮强大的(也有很多人推荐flask,将来有空的话我会试试).今天的话只是介绍一个小东西,django管 ...
随机推荐
- 打通web的三维国产引擎!老子云AMRT,够牛!
AMRT(Auto Mobile Reality Technology)指的是自动化移动现实技术,它是老子云3D模型自动轻量化引擎及轻量化模型格式.模型展示框架.API/SDK的统称.3D研发技术其中 ...
- VueX的热更替你知道多少?
前言 我们在使用Vuex的时候,会时不时的更改Vuex内的数据,但是页面不会随之更新,如果数据量大,一个数据依赖另一个数据的话,这样我们要是再刷新页面的话会把以前依赖的数据清空,效率特别低.所以,今天 ...
- 全新升级的AOP框架Dora.Interception[6]: 实现任意的拦截器注册方式
Dora.Interception提供了两种拦截器注册方式,一种是利用标注在目标类型.属性和方法上的InterceptorAttribute特性,另一种采用基于目标方法或者属性的调用表达式.通过提供的 ...
- Linux远程连接工具和运行级别
常用的Linux远程连接工具: xshell MobaXterm windows的命令行工具 Linux的运行级别 linux有七个运行级别 0----所有的服务都不开启,代表的式关机 1---代表的 ...
- python实现人脸关键部位检测(附源码)
人脸特征提取 本文主要使用dlib库中的人脸特征识别功能. dlib库使用68个特征点标注出人脸特征,通过对应序列的特征点,获得对应的脸部特征.下图展示了68个特征点.比如我们要提 取眼睛特征,获取3 ...
- IDEA插件配置之Eclipse Code Formatte
1.下载 在idea中的Plugins中下载插件 Eclipse Code Formatte,下载过之后重启. 2.配置 将自己下载的xml文件加载进来即可. 这个xml文件可自行在网上找找,有需要的 ...
- springboot中实现权限认证的两个框架
web开发安全框架 提供认证和授权功能! 一.SpringSecurity 1.导入依赖 <dependency> <groupId>org.springframework.b ...
- C++实现ETW进行进程变动监控
C++实现ETW进行进程变动监控 文章地址:https://www.cnblogs.com/Icys/p/EtwProcess.html 何为Etw ETW(Event Tracing for Win ...
- Template -「平衡树」
Fhq-Treap. // Fhq-Treap const int MAXN = 1e5 + 5; struct Fhq_Treap { #define Lson Tr[p].l #define Rs ...
- CF1703E Mirror Grid 题解
给定一个矩阵,判断最少将多少个格反转后使得旋转零度,九十度,一百八十度,二百七十度相等. 枚举矩阵每个位置是 \(0\) 还是 \(1\),若已经判断过则跳过,全统 \(1\) 和全统 \(0\) 取 ...