Hadoop2.0架构

如题所述

第1个回答 2022-06-15

对于很多人来说，大数据=Hadoop，大数据的相关技术源自Google的分布式计算和分布式文件系统（GFS），基于Google提出的分布式计算和文件系统，Apache Hadoop实现了自己的MapReduce和HDFS（Hadoop File System），并将其分享出来形成开源社区。如今Hadoop的开源社区发展地如火如荼，在MapReduce和HDFS的基础上Apache Hadoop发展出了更完善的生态系统，Hadoop2.0以上的版本核心组件有MapReduce计算架构、HDFS分布式文件系统、资源管理系统YARN和Common组件，其整体的生态构成图如下

相对于Hadoop 1.0，Hadoop 2.0加入了新的YARN组件，YARN是Yet another resource negotiator 的简称，总体上采用了双层调度架构，主要有以下几部分构成

（1）Resource Manager：负责资源管理的主服务，负责跟踪资源使用情况和节点活跃度，资源管理、调度和监控，它支持可插拔的资源调度器，自带了FIFO、Fair Scheduler和Capacity Scheduler三种调度器；

（2） Node Manager：是YARN的后台程序，负责认证Container租约，管理Container的从属，监控它们的执行情况。运行在每个节点上，负责资源管理和监控，它定期向Resource Manager汇报资源使用情况、故障和Container的生命周期，并接收来自Application Master的命令以启动Container（YARN中对资源的抽象），回收Container等；

（3）Application Master：负责管理单个应用程序，它向Resource Manager申请资源，负责动态改变资源消耗，管理执行流程，处理故障和计算偏差；

（4）Container：对资源的抽象，它封装了某个节点上的CPU、内存等资源，ApplicationMaster只有获得一个Container后才能启动任务，另外，ApplicationMaster本身也是运行在一个Container之中。

相似回答

请教hadoop2.0的ha如何配置答：将hadoop-slave1节点上的Zookeeper目录同步到hadoop-slave2和hadoop-slave3节点,并修改Zookeeper的数据文件。此外,不要忘记设置用户环境变量。 // 在hadoop-slave1中将zookeeper目录复制到其它节点 $ cd ~ $ scp -r app/cdh/zookeeper-3.4.5-cdh5.7.1hadoop-slave2:/home/hadoop/app/cdh $ scp -r app/cdh/zo...

hadoop2.0中最基础的两个组件是答：hadoop2.0中最基础的两个组件被称为 Hadoop分布式文件系统 (Hadoop Distributed File System, HDFS) 的文件存储，以及被称为 MapReduce 的编程框架。HDFS（Hadoop Distribute File System）：hadoop的数据存储工具。YARN（Yet Another Resource Negotiator,另一种资源协调者）：Hadoop 的资源管理器。Hadoop M...

Hadoop生态圈中的调度组件-YARN答：一、YARN：Hadoop集群中的同一资源调度系统。Hadoop2.0后引入，主要功能有：负责集群中资源的统一调度，响应客户端的请求。优缺点二、YARN核心组件及架构 1. ResourceManger（RM）：全局资源管理器，集群中只有一个活跃的RM，具体功能包括：处理客户端的请求；启动监控ApplicationMaster；监控NodeManger；资源...

Hadoop2.0中最基础的两个组件答：Hadoop的三大核心组件分别是：HDFS（Hadoop Distribute File System）：hadoop的数据存储工具。YARN（Yet Another Resource Negotiator,另一种资源协调者）：Hadoop 的资源管理器。Hadoop MapReduce:分布式计算框架。最基础的是hadoop的数据存储工具和Hadoop 的资源管理器。

如何架构大数据系统hadoop答：Hadoop体系架构 (1)Hadoop最底层是一个HDFS(Hadoop Distributed File System,分布式文件系统),存储在HDFS中的文件先被分成块,然后再将这些块复制到多个主机中(DataNode,数据节点)。 (2)Hadoop的核心是MapReduce(映射和化简编程模型)引擎,Map意为将单个任务分解为多个,而Reduce则意为将分解后的多任务结果汇总,该引擎...

如何架构大数据系统 hadoop答：3. 一种Hadoop多维分析平台的架构整个架构由四大部分组成:数据采集模块、数据冗余模块、维度定义模块、并行分析模块。数据采集模块采用了Cloudera的Flume,将海量的小日志文件进行高速传输和合并,并能够确保数据的传输安全性。单个collector宕机之后,数据也不会丢失,并能将agent数据自动转移到其他的colllecter处理,不会...

大家正在搜

rdna架构星火2.0.0.4 a76架构凯美瑞2.0和2.5哪个好什么是架构架构企业应用架构 gcn架构架构解读