django 连接MYSQL时,数据迁移时报:django.db.utils.InternalError: (1366, "Incorrect string value: '\\xE9\\x97\\xAE\\xE9\\xA2\\x98' for column 'name' at row 5") 这个问题是由于字符集的问题导致的: 注意要同时设置:character-set 和_set_server的字符集,再执行数据库的创建的时候,查询后会看到:…
使用Sqoop能够极大简化MySQL数据迁移至Hive之流程,并降低Hadoop处理分析任务时的难度. 先决条件:安装并运行有Sqoop与Hive的Hadoop环境.为了加快处理速度,我们还将使用Cloudera Quickstart VM(要求至少4 GB内存),不过大家也可以使用Hortonworks Data Platform(至少要求8 GB内存).由于我的笔记本电脑只有8 GB内存,因此我在这里使用CLoudera VM镜像. 如果大家需要使用Virtualbox运行Cloudera/…
近期接触了一个需求,业务背景是需要将关系型数据库的数据传输至HDFS进行计算,计算完成后再将计算结果传输回关系型数据库.听到这个背景,脑海中就蹦出了Sqoop迁移工具,可以非常完美的支持上述场景. 当然,数据传输工具还有很多,例如Datax.Kettle等等,大家可以针对自己的工作场景选择适合自己的迁移工具. 目录 一.介绍 二.架构 三.安装 1. 下载Sqoop 2. 配置环境变量 四.操作 1. 列出数据库 2. 列出数据表 3. MySQL导入到HDFS 4. HDFS导出到MySQL…
一.背景介绍 最近几天,接到公司的一个将当前大数据平台数据全部迁移到阿里云ODPS平台上的任务.而申请的这个ODPS平台是属于政务内网的,因考虑到安全问题当前的大数据平台与阿里云ODPS的网络是不通的,所以不能使用数据采集工作流模板. 然而,考虑到原大数据平台数据量并不是很大,可以通过将原大数据平台数据导出到CSV文件,然后再将CSV文件导入到ODPS平台.在这个过程中踩的坑有点多,所以想写篇文档作为记录. 二.大数据平台Hive数据导出到本地 编写export_data.sh脚本如下: #!/…
运行环境为windows 测试过260万的数据表,迁移大概要10分钟左右,当然肯定和网络,字段大小什么的有关系. 遇到的坑和注意点都用紫色标记了(对,就是我大乃团的高冷紫--Nogizaka 46) PS:第一次写这么长的东西 一.Mongodb导出命令mongoexport 本地安装Mongodb,在安装目录的/bin下按住shift并右键“在此处打开命令窗口”,可执行以下语句进行导出. mongoexport -h <ip:port> -d <database> -c <…
1.如果jumbo不存在,先安装jumbo 参考  http://hetu.baidu.com/api/tool/show?toolId=174: bash -c "$( curl  http://jumbo.baidu.com/install_jumbo.sh )"; source ~/.bashrc   2.先用jumbo search mysql,查找安装包,可知安装包名为mysql,版本5.5.30-1 接着用命令安装: jumbo install mysql  安装一直到屏幕…
目录 一. Sqoop介绍 二. Mysql 数据导入到 Hive 三. Hive数据导入到Mysql 四. mysql数据增量导入hive 1. 基于递增列Append导入 1). 创建hive表 2). 创建job 3). 执行job 2. Lastmodified 导入实战 1). 新建一张表 2). 初始化hive表: 3). 增量导入数据: 一. Sqoop介绍 Sqoop是一个用来将Hadoop和关系型数据库中的数据相互转移的工具,可以将一个关系型数据库(例如:MySQL.Oracl…
对于mysql /  hive 再进行统计的时候假设须要行变成列,能够使用函数 CASE 字段a WHEN 值b THEN c [WHEN d THEN e]* [ELSE f] END 当字段a=值b时,返回c(假设是字段的话则代表该字段的值,也能够是一个固定值 加单引號就能够):当a=d时,返回e.否则返回f. 如: 数据表结构:(举例说明.id有反复的) select id ,sum(CASE action when 'article' then count else 0 end) as…
1.概况 在CentOS7环境下,使用命令方式将MySQL数据从源端主机迁移到目标端主机上. 2.迁移全部数据库 1)源端备份: [root@hadoop102 /]# mysqldump -u root -p --all-databases > /backup/databasefile/102_all_databases_20190813.bak 2)拷贝到目标端: [root@hadoop102 mysql-libs]# scp /backup/databasefile/102_all_da…
问题描述 Django项目启动,当我们执行命令 python manage.py makemigrations 出现如下错误: File , in last_executed_query query = query.decode(errors='replace') AttributeError: 'str' object has no attribute 'decode' 解决办法 顺着报错信息,找到报错的位置,把 query = query.decode(errors='replace') 修…