hadoop yarn jobhistoryserver 配置

创建时间：2016-09-08 投稿人：浏览次数：5349

hadoop1.x之前的版本中可以开启50030端口,查看历史作业的运行日志,包括mr日志和自定义日志,但是hadoop2.x 是用MRv2(yarn)作为作业运行服务,代替50030端口的是一个jobhistory服务.jobhistory记录下已运行完的MapReduce作业信息并存放在指定的HDFS目录下，默认情况下是没有启动的，需要配置完后手工启动服务。

1、编辑mapred-site.xml文件:

<configuration>
        <property>
                <name>mapreduce.framework.name</name>
                <value>yarn</value>
        </property>
        <property>
                <name>mapreduce.jobhistory.address</name>
                <value>10.4.1.1:10020</value>
        </property>
        <property>
                <name>mapreduce.jobhistory.webapp.address</name>
                <value>10.4.1.1:19888</value>
        </property>
        <property>
                <name>mapreduce.jobhistory.joblist.cache.size</name>
                <value>1000</value>
                <description>default 20000</description>
        </property>
        <property>
                <name>mapred.child.java.opts</name>
                <value>-Xmx512m</value>
        </property>
        <property>
                <name>mapreduce.jobhistory.cleaner.enable</name>
                <value>true</value>
        </property>
        <property>
                <name>mapreduce.jobhistory.cleaner.interval-ms</name>
                <value>86400000</value>
                <description>the job history cleaner checks for files to delete, in milliseconds. Default 86400000 (one day). Files are only deleted if they are older than</description>
        </property>
        <property>
                <name>mapreduce.jobhistory.max-age-ms</name>
                <value>432000000</value>
        <description>Job history files older than this many milliseconds will be deleted when the history cleaner runs. Defaults to 604800000 (1 week)</description>
        </property>

2、启动history-server Hadoop启动jobhistoryserver来实现web查看作业的历史运行情况，由于在启动hdfs和Yarn进程之后，jobhistoryserver进程并没有启动，需要手动启动，启动的方法是通过(注意：必须是两个命令)： ./mr-jobhistory-daemon.sh start historyserver ./yarn-daemon.sh start timelineserver

启动完成后，查看进程
org.apache.hadoop.yarn.server.applicationhistoryservice.ApplicationHistoryServer
org.apache.hadoop.mapreduce.v2.hs.JobHistoryServer

3、验证

我们在Spark上以YARN方式启动一个任务，然后通过Hadoop YARN来查看日志

3.1 YARN模式下启动SPARK案例

bin/spark-submit  --class  org.apache.spark.examples.SparkPi 
--master yarn-cluster 
--num-executors 3 
--driver-memory 1g 
--executor-memory 1g 
--executor-cores 1 
lib/spark-examples*.jar  10

3.1 查看YARN-Cluster，并查看到刚才执行的任务，然后history->logs 就可以查看日志了

声明：该文观点仅代表作者本人，牛骨文系教育信息发布平台，牛骨文仅提供信息存储空间服务。

上一篇： Hadoop的jobhistoryserver配置
下一篇： Java修改JVM内存大小整理。（java heap space 解决方案）

热门文章: CTF writeup 2_南邮网络攻防训...; SSM框架——详细整合教程（...; Linux Shell脚本编程－－curl命...; HttpClient使用详解; Java面试题全集（上）; JAVA设计模式之单例模式; java.lang.OutOfMemoryError: PermGen ...; TCP协议中的三次握手和四次...; form表单的两种提交方式，su...; String,StringBuffer与StringBuilder...

最新文章: Java之品优购课程讲义_day20（7）; 剑指 Offer - 8：跳台阶; Netty权威指南_札记02_NIO编程; mysql时间属性之时间戳和datetime之...; 虚拟现实或许可以拯救古埃及的“...; spring cloud服务注册中心eureka---集群...; Java SE 第六章; HTTP请求+数据库; HIDL学习笔记之HIDL C++（第二天）; ubuntu系统下指定tomcat运行时为JDK1.8...