数据倾斜导致的致命后果: 1 数据倾斜直接会导致一种情况:OOM. 2 运行速度慢,特别慢,非常慢,极端的慢,不可接受的慢. 搞定数据倾斜需要: 1.搞定shuffle 2.搞定业务场景 3 搞定 cpu core的使用情况 4 搞定OOM的根本原因等. 数据倾斜的解决方案: 解决方案一:使用Hive ETL预处理数据 方案适用场景:导致数据倾斜的是Hive表.如果该Hive表中的数据本身很不均匀(比如某个key对应了100万数据,其他key才对应了10条数据),而且业务场景需要频繁使用Spar…