09
2020
11

用mapreduce怎么处理数据倾斜问题

让各分区的数据分布均匀


可以根据业务特点,设置合适的partition策略


如果事先根本不知道数据的分布规律,利用随机抽样器抽样后生成partition策略再处理

« 上一篇 下一篇 »

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。