整个Hadoop框架工作流程
2021/9/17 6:04:51
本文主要是介绍整个Hadoop框架工作流程,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
HDFS文件存储系统,负责文件的上传与下载,包含NameNode(一个)和DataNode(多个)两个部分,其中,NameNode存储的是源文件,即文件的存放位置,根据这个位置定位到节点;而DataNode才是真正负责存储数据文件的节点;
mapreduce 计算工作任务,包含整个map阶段和reduce阶段以及其中系统的shuffle过程;
yarn资源调度管理器,负责mapreduce工作任务的调度和命令的下达,他包含ResourceManager和NodeManager两个进程。其中,ResourceManage根据各节点的存储和工作情况来进行新任务的资源调度,而NodeManager则负责任务的命令下达。
这篇关于整个Hadoop框架工作流程的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2023-05-13Windows下hadoop环境搭建之NameNode启动报错
- 2023-04-14hadoop伪分布式集群的安装(不是单机版)
- 2022-12-05Hadoop生态系统—数据仓库Hive的安装
- 2022-11-02Win10搭建Hadoop环境
- 2022-10-19Hadoop生态系统(数据仓库Hive的安装)
- 2022-10-03Hadoop、storm和Spark Streaming简单介绍
- 2022-10-03胖虎的Hadoop笔记——Hadoop的伪分布式部署
- 2022-09-11Ubuntu搭建全分布式Hadoop
- 2022-09-11Ubuntu搭建全分布式Hadoop
- 2022-09-09Ubuntu下安装伪分布式HADOOP遇到的一些问题