MapReduce编程-MapReduce的高级特性
2021/7/31 17:07:45
本文主要是介绍MapReduce编程-MapReduce的高级特性,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
MapReduce的高级特性
1、序列化:
接口Writable(类似Java的序列化)
功能:实现自定义的数据类型
(1)举例:创建一个Employee类,封装员工数据,作为Map输出的value(v2,k2使用员工号)
2、排序:默认的排序规则:数字---升序
字符串---按照字典顺序
对象:按照员工的薪水
按照K2进行排序
自定义排序排序规则:数字、字符串、对象(WritableComparable)
3、分区:Partition(非常重要)
默认:MapReduce只有一个分区(一个分区是一个输出文件)
根据Map的输出建立分区<k2,v2>
举例:根据员工的部门号建立分区
4、Combiner合并,是一种特殊的Reduce;是MapReduce的一种优化的方式
(1)有些情况不能使用Combiner:求平均值
(2)不管有没有Combiner不能改变最后运行结果
(3)不管有没有Combiner,都不应该改变原有的处理逻辑。(案例:倒排索引)
5、MapReduce核心:Shuffle洗牌
这篇关于MapReduce编程-MapReduce的高级特性的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2024-11-26如何获取 OpenAI API Key 用于ChatGPT AI大模型开发?
- 2024-11-26MATLAB 中 A(7)=[];什么意思?-icode9专业技术文章分享
- 2024-11-26UniApp 中如何实现使用输入法时保持页面列表不动的效果?-icode9专业技术文章分享
- 2024-11-26在 UniApp 中怎么实现输入法弹出时禁止页面向上滚动?-icode9专业技术文章分享
- 2024-11-26WebSocket是什么,怎么使用?-icode9专业技术文章分享
- 2024-11-26页面有多个ref 要动态传入怎么实现?-icode9专业技术文章分享
- 2024-11-26在 UniApp 中实现一个底部输入框的常见方法有哪些?-icode9专业技术文章分享
- 2024-11-26RocketMQ入门指南:搭建与使用全流程详解
- 2024-11-26RocketMQ入门教程:轻松搭建与使用指南
- 2024-11-26手写RocketMQ:从入门到实践的简单教程