Hadoop 原理学习(8)Yarn 概述及其基本原理

[TOC]

一、Yarn 简介

Yarn 是 hadoop 集群的资源管理层。它允许不同的数据处理引擎(如图形处理、交互式 SQL、流处理、批处理)运行在 hadoop 集群中并处理 HDFS 中的数据(移动计算而非数据)。除了资源管理外,Yarn 还用于作业调用。

Yarn on hadoop

从资源管理方面看,Yarn 管理着由各个 NodeManager 节点的 vcore(CPU内核)和 RAM(运行时内存)共同组成的一组资源,比如我们的一个集群由35个 NodeManager 节点共560 vcores 和 3.4TiB的内存组成,那么 Yarn 管理的资源大小便是560 vcores + 3.4TiB RAM。当我们提交一个应用程序到 hadoop 集群时,Yarn 便会为这个应用程序分配一个资源池,这个资源池包含一定数量的 containers,每个 container 又包含一定数量的 vcores 和内存供应用程序运行。

二、Yarn 组件

Yarn 采用传统的 master-slave 架构模式,其主要由 4 种组件组成,它们的主要功能如下:

  • ResourceManager(RM):全局资源管理器,负责整个系统的资源管理和分配;
  • ApplicationMaster(AM):负责应用程序(Application)的管理;
  • NodeManager(NM):负责 slave 节点的资源管理和使用;
  • Container(容器):对任务运行环境的一个抽象。

Yarn 组件

ResourceManager (RM)

ResourceManager 是一个全局的资源管理器,负责整个系统的资源管理和分配。它主要由两个组件组成:

  • Scheduler:资源调度器,主要功能和特点如下:
    • 负责将资源分配给各种正在运行的应用程序,这些应用程序受到容量、队列等限制;
    • Scheduler 是纯调度程序,不会监视或跟踪应用程序的状态;
    • 由于应用程序故障或硬件故障,它不提供有关重新启动失败任务的保证;
    • Scheduler 根据应用程序的资源需求来执行其调度功能,它是基于资源容器的抽象概念来实现的,容器(Container)内包含内存、CPU、磁盘、网络等因素;
    • Scheduler 是一个可插拔的插件(即可配置),负责在各种队列、应用程序等之间对集群资源进行区分。当前支持的Scheduler类包括:FairScheduler、FifoScheduler、CapacityScheduler;
  • Applocation Manager:负责接受 job 提交请求,为应用程序分配第一个 Container 以运行 ApplicationMaster,并提供失败时重新启动运行着 ApplicationMaster 的 Container 的服务。

ApplicationMaster(AM)

当用户提交一个应用程序时,将启动一个被称为 ApplcationMaster 的轻量级进程的实例,用以协调应用程序内所有任务的执行。它的主要工作包括:

  • 向 ResourceManager 申请并以容器(Container)的形式提供计算资源;
  • 管理在容器内运行的任务:
    • 跟踪任务的状态并监视它们的执行;
    • 遇到失败时,重新启动失败的任务;
    • 推测性的运行缓慢的任务以及计算应用计数器的总值。

NodeManager(NM)

NodeManager 进程运行在集群中的节点上,是每个节点上的资源和任务管理器。它的主要功能包括:

  • 接收 ResourceManager 的资源分配请求,并为应用程序分配具体的 Container;
  • 定时地向 ResourceManager 汇报本节点上的资源使用情况和各个 Container 的运行状态,以确保整个集群平稳运行;
  • 管理每个 Container 的生命周期;
  • 管理每个节点上的日志;
  • 接收并处理来自 ApplicationMaster 的 Container 启动/停止等请求。

Container(容器)

Container 是 Yarn 中的资源抽象,是执行具体应用的基本单位,它包含了某个 NodeManager 节点上的多维度资源,如内存、CPU、磁盘和网络 IO,当然目前仅支持内存和 CPU。

任何一个 Job 或应用程序必须运行在一个或多个 Container 中,在 Yarn 中,ResourceManager 只负责告诉 ApplicationMaster 哪些 Containers 可以用,ApplicationMaster 需要自己去找 NodeManager 请求分配具体的 Container。

Container 和集群节点的关系是:一个节点会运行多个 Container,但一个 Container 不会跨节点。

三、提交任务流程

客户端向RM提交任务流程

客户端向RM提交任务流程

说明:

  1. 客户端向 RM 发出请求;
  2. RM 返回一个 ApplicationID 作为回应;
  3. 客户端向 RM 回应 Application Submission Context(ASC)和 Container Launch Context(CLC)信息。其中 ASC 包括 ApplicationID、user、queue,以及其它一些启动 AM 相关的信息,CLC 包含了资源请求数(内存与CPU),Job 文件,安全 token,以及其它一些用于在 NM 上启动 AM的信息;
  4. 当 ResourceManager 接受到 ASC 后,它会调度一个合适的 container 来启动 AM,这个 container 经常被称做 container 0。AM 需要请求其它的 container 来运行任务,如果没有合适的 RM,AM 就不能启动。当有合适的 container 时,RM 发请求到合适的 NM 上,来启动 AM。这时候,AM 的 PRC 与监控的 URL 就已经建立了;
  5. 当 AM 启动起来后,RM 回应给 AM 集群的最小与最大资源等信息。这时 AM 必须决定如何使用那么当前可用的资源。YARN 不像那些请求固定资源的 scheduler,它能够根据集群的当前状态动态调整;
  6. AM 根据从 RM 那里得知的可使用的资源,它会请求一些一定数目的 container。这个请求可以是非常具体的包括具有多个资源最小值的 Container(例如额外的内存等);
  7. RM 将会根据调度策略,尽可能的满足 AM 申请的 container;
  8. AM 根据分配的信息,去找NM启动对应的 container。

运行状态交互

当一个任务运行时,AM 会向 RM 汇报心跳与进度信息,在这些心跳过程中,AM 可能会去申请或者释放 Container。当任务完成时,AM 向 RM 发送一条任务结束信息然后退出。AM 与 RM 交互的示例如下图:

AM与RM交互示例

四、总结

与 HDFS/HBase 一样,Yarn 也使用了简洁的 master-salve 架构,这不仅更容易让人理解它的运行原理,也更方便了运维人员对集群的管理,仿佛《道德经》中提到的“万物之始,大道至简,衍化至繁”一样。同时,将集群的资源抽象,这也可作为将面向对象思想运用的一个经典示例,毕竟,一切皆对象 For Java。

五、参考链接

注:此文章主要为学习的笔记,其中大量的翻译了参考链接中的资料,并有改动,如有需要,请阅读原文。

数据同步项目总结2-数据流

* TOC{:toc}数据流是指数据从源端存储库到目的端存储库的一个流动过程,这个过程与数据的有序性、吞吐量、安全点、统计等功能或特性息息相关,经过多次调整,最终在线上环境的测试中,单个作业的 SQLServer -> Kafka 的同步速度能够维持在 3800000+ r...… Continue reading