impala 表迁移方式 partquet数据文件移动方法
1、原表查询:
select count(*) from edm.ucard_wxd0123 where stat_dt = '2024-01-09' and id_no = '110101199003072893'
2、查看数据文件
hadoop fs -ls /user/hive/warehouse/edm.db/ucard_wxd0123/stat_dt=2024-01-09
Found items
-rw-r--r-- impala hive -- : /user/hive/warehouse/edm.db/ucard_wxd0123/stat_dt=--/214b1691c9ed3b01-dfd95f5f00000000_894437036_data..parq
-rw-r--r-- impala hive -- : /user/hive/warehouse/edm.db/ucard_wxd0123/stat_dt=--/214b1691c9ed3b01-dfd95f5f00000001_1509455238_data..parq
3、创建一张表
create table edm.ucard_wxd0123_20191211 like edm.ucard_wxd0123
4、获取parquet 格式文件
hadoop fs -get /user/hive/warehouse/edm.db/ucard_wxd0123/stat_dt=--/214b1691c9ed3b01-dfd95f5f00000000_894437036_data..parq
hadoop fs -get /user/hive/warehouse/edm.db/ucard_wxd0123/stat_dt=--/214b1691c9ed3b01-dfd95f5f00000001_1509455238_data..parq
5、创建分区目录
hadoop fs -mkdir /user/hive/warehouse/edm.db/ucard_wxd0123_20191211/stat_dt=2024-01-09
6、上传partquet文件
hadoop fs -put 214b1691c9ed3b01-dfd95f5f00000000_894437036_data..parq /user/hive/warehouse/edm.db/ucard_wxd0123_20191211/stat_dt=--/
hadoop fs -put 214b1691c9ed3b01-dfd95f5f00000001_1509455238_data..parq /user/hive/warehouse/edm.db/ucard_wxd0123_20191211/stat_dt=--/
7、Hive中修复表信息
msck REPAIR TABLE edm.ucard_wxd0123_20191211;
8、Impala 中刷新元数据
Invalidate metadata edm.ucard_wxd0123_20191211;
9、进行查询
select * from edm.ucard_wxd0123_20191211;
可以显示结果
总结:我们可以迁移partquet 文件到指定分区,然后进行查询数据。
impala 表迁移方式 partquet数据文件移动方法的更多相关文章
- 表空间tablespace,数据文件datafiles,和控制文件control files介绍
https://docs.oracle.com/cd/B19306_01/server.102/b14220/physical.htm#i5919 本文系翻译 表空间tablespace,数据文件da ...
- ORACLE中如何找出大表分布在哪些数据文件中?
ORACLE中如何找出大表分布在哪些数据文件中? 在ORACLE数据中,我们能否找出一个大表的段对象分布在哪些数据文件中呢? 答案是可以,我们可以用下面脚本来找出对应表的区.段分别位于哪些数据文件 ...
- Oracle 12C 新特性之在线重命名、迁移活跃的数据文件
Oracle 数据库 12c 版本中对数据文件的迁移或重命名不再需要太多繁琐的步骤,可以使用 ALTER DATABASE MOVE DATAFILE 这样的 SQL 语句对数据文件进行在线重命名和移 ...
- ORACLE数据库数据文件转移方法(不同于move方法)
1) 手动拷贝要转移的数据数据文件'd:\OracleData\GWTABLE42.DBF'到新的位置'E:\OracleData\GWTABLE42.DBF'. 2) 把数据文件所属的表空间Offl ...
- web 表单方式上传文件方法(不用flash插件)
原理:使用表单的input type="file"标签,通过ajax提交表单请求,后台获取请求中的文件信息,进行文件保存操作 由于我测试用的做了一个上传文件和上传图片方法,所以我有 ...
- c#自带压缩类实现数据库表导出到CSV压缩文件的方法
在导出大量CSV数据的时候,常常体积较大,采用C#自带的压缩类,可以方便的实现该功能,并且压缩比例很高,该方法在我的开源工具DataPie中已经经过实践检验.我的上一篇博客<功能齐全.效率一流的 ...
- sql 用xml方式插入数据乱码问题解决方法
sql 使用存储过程 参数为xml字符串 xml不要写编码,如下 <?xml version=\"1.0\" ?><root>数据字符串</root& ...
- Jquery构建Form表单Post提交数据的简单方法
$.extend({ PostSubmitForm: function (url, args) { var body = $(document.body), form = $("<fo ...
- 表空间与数据文件Offline,online的区别
首先明确,表空间与数据文件的关系:Oracle数据库表空间有两种,一种smallfile小文件表空间(默认),另一种bigfile大文件表空间: 默认表空间与数据文件的关系:允许一对多的处理方式,一个 ...
随机推荐
- 深入学习c++--多线程编程(二)【当线程间需要共享非const资源】
1. 遇到的问题 #include <iostream> #include <thread> #include <chrono> #include <futu ...
- 全面系统Python3入门+进阶-1-8 Python的前景
语言的热度. python在开发效率上有优势 大数据.人工智能 结束
- 【Leetcode_easy】1047. Remove All Adjacent Duplicates In String
problem 1047. Remove All Adjacent Duplicates In String 参考 1. Leetcode_easy_1047. Remove All Adjacent ...
- 什么时候该用readfile() , fread(), file_get_contents(), fgets()?
fread() 和 readfile() fread() 最大一次性能读取 8k长度的字节数,所以不能一次性读取大文件去作下载. 优势在于,操作更加灵活,每次读取指定字节的内容,用于下载时方便控制服务 ...
- 【GStreamer开发】GStreamer基础教程09——收集媒体信息
目标 有时你需要快速的了解一个文件(或URI)包含的媒体格式或者看看是否支持这种格式.当然你可以创建一个pipeline,设置运行,观察总线上的消息,但GStreamer提供了一个工具可以帮你做这些. ...
- 非常好用的JavaScript 工具库--lodash
一.什么是lodash? lodash库是一个具有一致接口.模块化.高性能等特性的 JavaScript 工具库. lodash是一个javascript库,也是Node JS的常用模块,它内部封装了 ...
- Android StickyListHeadersListView头部悬停 分组列表实现
最近在做分组列表,头部悬停的效果,在github上就搜到了StickyListHeaders(https://github.com/emilsjolander/StickyListHeaders)这个 ...
- HDU 4352:XHXJ's LIS
题目:(原题是英文而且很迷) 求区间内数的LIS长度==k的个数,比如153948的LIS为1 3 4 8,长度为4.据说这种题叫DP中DP,本来是线性,再套一层状压+数位,简直厉害到不行…… 线性的 ...
- PCA分析的疑问
R 与python scikit-learn PCA的主成分结果有部分是反的 通过R和python分别计算出来的PCA的结果存在某些主成分的结果是相反的,这些结果是没有问题的,只是表示这个分量被反转了 ...
- PHP与Cookie
不管什么语言写的cookie,本质上没区别. cookie 常用于识别用户.cookie 是服务器留在用户计算机中的小文件.每当相同的计算机通过浏览器请求页面时,它同时会发送 cookie.通过 PH ...