04 Hadoop思想与原理
2021/10/23 6:11:26
本文主要是介绍04 Hadoop思想与原理,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
1.用图与自己的话,简要描述Hadoop起源与发展阶段。(作业3中剪过来)
(1)Hadoop起源于Google的三大论文:
GFS:Google的分布式文件系统Google File System
MapReduce:Google的MapReduce开源分布式并行计算框架
BigTable:一个大型的分布式数据库
(2)Hadoop的发展:
0.x系列版本:hadoop当中最早的一个开源版本,在此基础上演变而来的1.x以及2.x的版本
1.x版本系列:hadoop版本当中的第二代开源版本,主要修复0.x版本的一些bug等
2.x版本系列:架构产生重大变化,引入了yarn平台等许多新特性
2.用图与自己的话,简要描述名称节点、第二名称节点、数据节点的主要功能及相互关系。
名称结点(NameNode):1.负责文件和目录的创建、删除和重命名等 2.管理着数据结点和文件块的映射关系 3.处理客户端的访问请求
数据结点(DataNode):1.负责数据的存储和读取 2.根据名称结点的命令创建、删除和复制数据块 3.心跳机制,与名称结点保持通信。
第二名称结点(SecondaryNode):1.完成EditLog和FsImage的合并操作,减少EditLog文件大小,缩短名称结点重启时间
2.作为名称结点的”检查点“,保存名称结点中的元数据信息。
这篇关于04 Hadoop思想与原理的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2023-05-13Windows下hadoop环境搭建之NameNode启动报错
- 2023-04-14hadoop伪分布式集群的安装(不是单机版)
- 2022-12-05Hadoop生态系统—数据仓库Hive的安装
- 2022-11-02Win10搭建Hadoop环境
- 2022-10-19Hadoop生态系统(数据仓库Hive的安装)
- 2022-10-03Hadoop、storm和Spark Streaming简单介绍
- 2022-10-03胖虎的Hadoop笔记——Hadoop的伪分布式部署
- 2022-09-11Ubuntu搭建全分布式Hadoop
- 2022-09-11Ubuntu搭建全分布式Hadoop
- 2022-09-09Ubuntu下安装伪分布式HADOOP遇到的一些问题