【visual box源码】【nacos源码下载】【啤酒溯源码】yarn container源码-皮皮网

【visual box源码】【nacos源码下载】【啤酒溯源码】yarn container源码

2025-01-31 13:58:08 来源：{typename type="name"/} 分类：{typename type="name"/}

1.yarnè¯¦è§£
2.YARNå·¥ä½åç YARNè°åº¦å¨
3.å¦ä½çè§£ yarn ç container
4.开启 Kerberos 安全的大数据环境中，Yarn Container 启动失败导致作业失败
5.yarn源码分析（四）AppMaster启动
6.Spark源码解析2-YarnCluster模式启动

yarn container源码

yarnè¯¦è§£

yarnçç»æå¯ä»¥ä»ä¸¤ä¸ªè§åº¦çå¾ï¼

å¶ä¸ï¼å¨master nodeä¸è¿è¡ResourceManagerã

æ¯ä¸ªdatanodeä¸è¿è¡ä¸ä¸ªNodeManagerã

å¹¶æè¯¥dataNodeä¸çææè®¡ç®èµæºï¼CPUãååï¼è§ä¸ºä¸ä¸ª/å¤ä¸ªContainerï¼èContainerå¯ä»¥è¢«åéæ§è¡ä¸ä¸ªtask(ApplicationMasterãmap taskãreduce taskç)ã

å·ä½å¯çä¸å¾ï¼

å¯ç»åä¸æçå¾ççè§£

Containeræ¯Yarnæ¡æ¶çè®¡ç®ååï¼æ¯å·ä½æ§è¡åºç¨taskï¼å¦map taskãreduce taskï¼çåºæ¬åä½ã

ä»»ä½ä¸ä¸ªjobæapplicationå¿é¡»è¿è¡å¨ä¸ä¸ªæå¤ä¸ªContainerä¸ãå¨Yarnæ¡æ¶ä¸ï¼ResourceManageråªè´è´£åè¯ApplicationMasteråªäºContainerså¯ä»¥ç¨ï¼ApplicationMasterè¿éè¦å»æ¾NodeManagerè¯·æ±åéå·ä½çContainerã

NodeManagerè¿ç¨è¿è¡å¨éç¾¤ä¸çèç¹ä¸ï¼æ¯ä¸ªèç¹é½ä¼æèªå·±çNodeManagerãNodeManageræ¯ä¸ä¸ªslaveæå¡ï¼

éè¿åResourceManageréåï¼NodeManagerè´è´£æ´ä¸ªHadoopéç¾¤ä¸çèµæºåéå·¥ä½ã

ResourceManagerä¸»è¦æä¸¤ä¸ªç»ä»¶ï¼ScheduleråApplicationManagerã

å¦ä¸ä¸ªç»ä»¶ApplicationManagerçåè½å¦ä¸ï¼

ApplicationMasterè¿è¡å¨Containerä¸ã

1.clientåyarnæäº¤jobï¼é¦åæ¾ResourceManageråéèµæºï¼

2.ResourceManagerå¼å¯ä¸ä¸ªContainer,å¨Containerä¸è¿è¡ä¸ä¸ªApplication manager

3.Application manageræ¾ä¸å°nodemanagerå¯å¨Application masterï¼è®¡ç®ä»»å¡æéçè®¡ç®

4.Application masteråApplication managerï¼Yarnï¼ç³è¯·è¿è¡ä»»å¡æéçèµæº

5.Resource schedulerå°èµæºå°è£åç»Application master

6.Application masterå°è·åå°çèµæºåéç»åä¸ªnodemanager

7.åä¸ªnodemanagerå¾å°ä»»å¡åèµæºå¼å§æ§è¡map task

8.map taskæ§è¡ç»æåï¼å¼å§æ§è¡reduce task

9.map taskå reduce taskå°æ§è¡ç»æåé¦ç»Application master

.Application masterå°ä»»å¡æ§è¡çç»æåé¦pplication managerã

åä¸ªç»ä»¶çåè½

ä¸ä¸ªJobçæäº¤è¿ç¨

blogs.com/yangsy/p/.html

åè½ä¸è¿è¡è¿ç¨

blogs.com/xwdreamer/archive////.html

YARNå·¥ä½åç YARNè°åº¦å¨

æ§çMapReduceæ¶æ

Containeræ°é=min (2 CORES, 1.8 DISKS, (å¯ç¨åå)/æä½Containerçå¤§å°)

æåè®¡ç®çæ¯ä¸ªContainerçååå¤§å°æ¯

æ¯ä¸ªContainerçååå¤§å° = max(æå°Containerååå¤§å°, (æ»å¯ç¨åå) /Containeræ°))

å¦ä½çè§£ yarn ç container

ããå½æä¸ä¸ªApplicationï¼å¨MRV1éå«Jobï¼ï¼ç¬¬ä¸ä¸ªcontainerå°±ç¨æ¥è·ApplicationMasterï¼ç¶åApplicationMasteråç³è¯·ä¸äºcontaineræ¥è·Mapperï¼ä¹ååç³è¯·ä¸äºcontaineræ¥è·Reducerã

ããcontaineræ¢å¯ä»¥è·Mapperä¹å¯ä»¥è·Reducerï¼å°±ä¸åMRV1éçmap slotåªè½è·mapãreduce slotåªè½è·reduceã

开启 Kerberos 安全的大数据环境中，Yarn Container 启动失败导致作业失败

在开启Kerberos安全的大数据环境时，经常会遇到Yarn Container启动失败导致的spark/hive作业失败问题。以下是分析和解决这些问题的关键步骤。

问题1：在大数据集群中开启kerberos安全认证后，visual box源码提交hive on mr/hive on spark任务到YARN执行失败。查看YARN web UI，发现报错信息指向了YARN Container启动失败。

问题2：同样地，在集群中开启kerberos安全认证并提交spark on hive任务到YARN后，执行同样失败，YARN web UI中显示了相关的nacos源码下载错误信息。

分析过程：在分析问题时，我们注意到在使用命令查询作业详细日志时，无法找到任何相关日志（确认了YARN已开启日志聚合），并且在HDFS文件系统中发现已创建了作业日志对应的目录，但该目录下没有文件。此外，我们注意到集群中启用了Hive代理：hive.server2.enable.doAs=true。结合YARN web UI中的关键报错信息，可以确认是因为集群中YARN nodeManager节点上没有相关业务用户，导致YARN Container启动失败，进而导致作业无法执行。

原因：YARN Container启动失败的啤酒溯源码主要原因是YARN nodeManager节点上缺少相关的业务用户，这可能是由于用户管理配置不当、权限问题或者用户信息未正确同步等原因导致。

解决方案：解决此问题的关键在于确保YARN nodeManager节点上包含所有需要的业务用户。这通常涉及到调整用户管理配置、确保用户信息正确同步至YARN环境，以及可能的权限管理调整。具体步骤可能包括检查HDFS和YARN的用户配置文件、验证用户信息同步机制（如Kerberos或LDAP的集成）、确保用户在YARN节点上正确创建或存在等。

技术背景：本文由mdnice多平台发布，旨在分享大数据环境中的Kerberos安全配置与YARN作业执行问题的排查与解决策略，提供给开发者和系统管理员作为参考。dapp空投源码

yarn源码分析（四）AppMaster启动

在容器分配完成之后，启动容器的代码主要在ContainerImpl.java中进行。通过状态机转换，container从NEW状态向其他状态转移时，会调用RequestResourceTransition对象。RequestResourceTransition负责将所需的资源进行本地化，或者避免资源本地化。若需本地化，还需过渡到LOCALIZING状态。为简化理解，此处仅关注是否进行资源本地化的情况。

为了将LAUNCH_CONTAINER事件加入事件处理队列，板凳音乐源码调用了sendLaunchEvent方法。该事件由ContainersLauncher负责处理。ContainersLauncher的handle方法中，使用一个ExecutorService（线程池）容器Launcher。ContainerLaunch实现了Callable接口，其call方法生成并执行launch_container脚本。以MapReduce框架为例，该脚本在hadoop.tmp.dir/application name/container name目录下生成，其主要作用是启动MRAppMaster进程，即MapReduce的ApplicationMaster。

Spark源码解析2-YarnCluster模式启动

YARN 模式运行机制主要体现在Yarn Cluster 模式和Yarn Client 模式上。在Yarn Cluster模式下，SparkSubmit、ApplicationMaster 和 CoarseGrainedExecutorBackend 是独立的进程，而Driver 是独立的线程；Executor 和 YarnClusterApplication 是对象。在Yarn Client模式下，SparkSubmit、ApplicationMaster 和 YarnCoarseGrainedExecutorBackend 也是独立的进程，而Executor和Driver是对象。

在源码中，SparkSubmit阶段首先执行Spark提交命令，底层执行的是开启SparkSubmit进程的命令。代码中，SparkSubmit从main()开始，根据运行模式获取后续要反射调用的类名赋给元组中的ChildMainClass。如果是Yarn Cluster模式，则为YarnClusterApplication；如果是Yarn Client模式，则为主类用户自定义的类。接下来，获取ChildMainClass后，通过反射调用main方法的过程，反射获取类然后通过构造器获取一个示例并多态为SparkApplication，再调用它的start方法。随后调用YarnClusterApplication的start方法。在YarnClient中，new一个Client对象，其中包含了yarnClient = YarnClient.createYarnClient属性，这是Yarn在SparkSubmit中的客户端，yarnClient在第行初始化和开始，即连接Yarn集群或RM。之后就可以通过这个客户端与Yarn的RM进行通信和提交应用，即调用run方法。

ApplicationMaster阶段主要涉及开启一个Driver新线程、AM向RM注册、AM向RM申请资源并处理、封装ExecutorBackend启动命令以及AM向NM通信提交命令由NM启动ExecutorBackend。在ApplicationMaster进程中，首先开启Driver线程，开始运行用户自定义代码，创建Spark程序入口SparkContext，接着创建RDD，生成job，划分阶段提交Task等操作。

在申请资源之前，AM主线程创建了Driver的终端引用，作为参数传入createAllocator()，因为Executor启动后需要向Driver反向注册，所以启动过程必须封装Driver的EndpointRef。AM主线程向RM申请获取可用资源Container，并处理这些资源。ExecutorBackend阶段尚未完成，后续内容待补充。

【visual box源码】【nacos源码下载】【啤酒溯源码】yarn container源码

相关文章