最近有一个将 mysql 数据导入到 MongoDB 中的需求,打算使用 Kettle 工具实现.本文章记录了数据导入从0到1的过程,最终实现了每秒钟快速导入约 1200 条数据.一起来看吧~ 一.Kettle 连接图 简单说下该转换流程,增量导入数据: 1)根据 source 和 db 字段来获取 MongoDB 集合内 business_time 最大值. 2)设置 mysql 语句 3)对查询的字段进行改名 4)过滤数据:只往 MongoDB 里面导入 person_id,address,…
MySQL基础 关于MySQL数据导出导入的文章,目的有二: 1.备忘 2.供开发人员测试 工具 mysqlmysqldump 应用举例 导出 导出全库备份到本地的目录 mysqldump -u$USER -p$PASSWD -h127.0.0.1 -P3306 --routines --default-character-set=utf8 --lock-all-tables --add-drop-database -A > db.all.sql 导出指定库到本地的目录(例如mysql库) my…
增量导入 在实际工作当中,数据的导入,很多时候都是只需要导入增量数据即可,并不需要将表中的数据全部导入到hive或者hdfs当中去,肯定会出现重复的数据的状况,所以我们一般都是选用一些字段进行增量的导入,为了支持增量的导入,sqoop也给我们考虑到了这种情况并且支持增量的导入数据 增量导入是仅导入新添加的表中的行的技术. 它需要添加‘incremental’, ‘check-column’, 和 ‘last-value’选项来执行增量导入. 下面的语法用于Sqoop导入命令增量选项. --inc…
sqoop将mysql数据表导入到hive报错 [root@ip---- lib]# sqoop import --connect jdbc:mysql://54.223.175.12:3308/gxt3 --username guesttest --password guesttest --table ecomaccessv3 -m 1 --hive-import Warning: /opt/cloudera/parcels/CDH--.cdh5./bin/../lib/sqoop/../ac…
实现思路:       实现Java读取TXT文件中的内容并存到内存,将内存中的数据和mysql 数据库里面某张表数据的字段做一个比较,如果比较内存中的数据在mysql 里存在则不做处理,如果不存在则将该数据插入mysql数据库中 步骤1.读取文本数据   给一个string 返回值 步骤2.查询mysql 表中数据  给一个String 返回值 步骤3  .内存中文本数据和读取的mysql 数据做比较 /** * 实现读取文件信息 * * @param fileName * @return *…
MySQL从4.1版本开始才提出字符集的概念,所以对于MySQL4.0及其以下的版本,他们的字符集都是Latin1的,所以有时候需要对mysql的字符集进行一下转换,MySQL版本的升级.降级,特别是升级MySQL的版本,为了不让程序继续沿用Latin1字符集之后对以后Discuz!版本升级的影响和安装SupeSite,这就需要我们进行字符集的转换!   本人转换过好多数据了,也用过了好多的办法,个人感觉最好用的就是使用MySQL命令导出导入中将字符集转换过去!   现在我将用图文并茂的方式向大…
数据库数据的导入和导出受secure_file_priv配置项影响#限制导入导出,null时无法进行数据的导入导出,空时不限制,设置了目录则只能对该目录下的文件进行导入导出show variables like "secure_file_priv" 查看#--------------------------------------------------------------------------------------#导出: 语法: SELECT ... INTO OUTFIL…
我在使用C#(VS2008)读取MySql数据库(5.1版本)时,返回的DataTable数据中arrivalDate字段数据显示为System.Array[]形式(程序中没有对返回的数据进行任何加工),数据读取时,是使用ADO.Net调用MySql.Data.dll类库(类库版本是5.2.3.0,该类库应该是mysql官方提供的)然后检查Sql语句是否有问题,如下图中的sql 该sql语句在Mysql数据中执行没有问题,本身项目内部没有对数据进行任何加工,那么错误就是可以定位在MySql.Da…
1,每天4点备份mysql数据: 2,为节省空间,删除超过3个月的所有备份数据: 3,删除超过7天的备份数据,保留3个月里的 10号 20号 30号的备份数据: mysqldump -u用戶名 -p密码 -d 数据库名 表名 > 脚本名; 导出整个数据库结构和数据 mysqldump -h localhost -uroot -p123456 database > dump.sql 导出单个数据表结构和数据 mysqldump -h localhost -uroot -p123456  data…
工具/原料 SQL Server Management Studio 已建立SQL数据库 方法/步骤   打开SQL Server Management Studio,按图中的路径进入导入数据界面.   导入的时候需要将EXCEL的文件准备好,不能打开.点击下一步.   数据源:选择“Microsoft Excel”除了EXCEL类型的数据,SQL还支持很多其它数据源类型.   选择需要导入的EXCEL文件.点击浏览,找到导入的文件确定.   再次确认文件路径没有问题,点击下一步.   默认为是…