Spark分区

2022/1/25 6:07:02

本文主要是介绍Spark分区,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!

  • 默认采用的是Hash分区
    缺点:可能导致每个分区中数据量的不均匀,极端情况下会导致某些分区拥有RDD的全部数据

  • Ranger分区
    要求RDD中的KEY类型必须可以排序

  • 自定义分区
    根据需求,自定义分区



这篇关于Spark分区的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!


扫一扫关注最新编程教程