Hadoop-MapReduce-Yarn集群搭建

搭建的部署节点图如下：

hdfs和yarn是两个不同概念，两者搭建不会冲突。注意一点是DataNode和NodeManager必须要部署在同一台机器，它们的比例是1比1关系的。否则DataNode只能存储，不能做相应的计算处理。

通过官网搭建：hadoop.apache.org/docs/r2.6.5/hadoop-project-dist/hadoop-common/SingleCluster.html

主要涉及到两个配置文件: mapred-site.xml 、yarn-site.xml

一、MapReduce on Yarn单节点搭建

修改hadoop目录下的etc/hadoop/mapred-site.xml文件：

    <configuration>
        <property>
            <name>mapreduce.framework.namename>
            <value>yarnvalue>
        property>
    configuration>

修改etc/hadoop/yarn-site.xml文件：

    <configuration>
        <property>
            <name>yarn.nodemanager.aux-servicesname>
            <value>mapreduce_shufflevalue>
        property>
    configuration>

yarn里面配置nodemanager的一个服务叫做mapreduce_shuffle，shuffle又叫”洗牌“，就像你打牌，把相同花色的牌放在一块。而在mapReduce中，reduce按分区号拉取map处理好的记录，相当于洗牌这一操作，把相同分区的放在一个reduce里。shuffle就是mapReduce中map到reduce之间集成的东西。为什么要在nodemanager配置mapReduce的shuffle呢，主要是要让nodemanager来协调shuffle从map拉取数据到reduce之间的一个过程。

上面配置好了之后，就可以直接使用下面命令启动yarn（单点的）

  $ sbin/start-yarn.sh

使用下面命令停止yarn

      $ sbin/stop-yarn.sh

这里配置的是单节点的yarn，并不是集群模式，不是HA高可用的，我们下面来配置HA模式，当然HA模式的配置要依赖上面两个配置文件的内容。

二、搭建高可用的yarn

yarn HA搭建官网地址：https://hadoop.apache.org/docs/r2.6.5/hadoop-yarn/hadoop-yarn-site/ResourceManagerHA.html

下面是yarn HA模式的架构图：

上图出现了2个ResourceManager，也是主备模式。可能你有个疑问，为什么yarn的ha不像hdfs中的HA模式，使用个新增角色ZKFC来协调主备切换呢？

其实在hadoop2.x中，yarn并不是像hdfs的ha一样新增角色来检测切换主备节点，而是直接在RM进程中增加了HA的模块。不过这个yarn的ha模块默认是关闭的，需要手动在配置文件开启。

yarn这样做有个好处，就是RM的状态很明确，要么就是活着，要么就是宕机，不会像hdfs中的一样，可能会存在一个中间态(当ZKFC宕机，而NN存活，此时要为这个NN做降级操作) 。

1、在配置文件配置yarn HA

在node1中，cd到$HADOOP_HOME/etc/hadoop目录下

    [root@node1 hadoop]# cp mapred-site.xml.template mapred-site.xml
    [root@node1 hadoop]# vim mapred-site.xml

然后修改mapred-site.xml加入配置：

    <configuration>
        <property>
            <name>mapreduce.framework.namename>
            <value>yarnvalue>
        property>
    configuration>

然后修改yarn-site.xml

    [root@node1 hadoop]# vim yarn-site.xml

加入下面的配置

    <property>
       <name>yarn.nodemanager.aux-servicesname>
       <value>mapreduce_shufflevalue>
     property>
    <property>
       <name>yarn.resourcemanager.ha.enabledname>
       <value>truevalue>
     property>
     <property>
       <name>yarn.resourcemanager.zk-addressname>
       <value>node1:2181,node2:2181,node3:2181value>
     property>
    
     <property>
       <name>yarn.resourcemanager.cluster-idname>
       <value>yarncluster1value>
     property>
     <property>
       <name>yarn.resourcemanager.ha.rm-idsname>
       <value>rm1,rm2value>
     property>
     <property>
       <name>yarn.resourcemanager.hostname.rm1name>
       <value>node2value>
     property>
     <property>
       <name>yarn.resourcemanager.hostname.rm2name>
       <value>node3value>
     property>

yarn.resourcemanager.ha.enabled：开启yarn的HA模式，默认是false

yarn.resourcemanager.zk-address ： yarn的RM连接ZK的地址

yarn.resourcemanager.cluster-id： yarn的集群id，值可以自定义。因为ZK集群是可以被多个集群复用的，那么不同的集群在使用zk做分布式锁控制时，实际上会根据这个配置项里的值在zk生成一个目录，这样相同集群的机器就在这个目录上争抢创建锁，不会影响到其他的集群。

yarn.resourcemanager.ha.rm-ids: yarn中RM的主机逻辑名

yarn.resourcemanager.hostname.rm2 : yarn中RM主机逻辑名对应的具体物理主机配置。

至此yarn的HA就配置完成了。
分发上面的配置文件

    [root@node1 hadoop]# scp mapred-site.xml yarn-site.xml node2:`pwd`
    mapred-site.xml                               100%  863   401.2KB/s   00:00    
    yarn-site.xml                                 100% 1416   453.9KB/s   00:00    
    [root@node1 hadoop]# scp mapred-site.xml yarn-site.xml node3:`pwd`
    mapred-site.xml                               100%  863   588.9KB/s   00:00    
    yarn-site.xml                                 100% 1416     1.4MB/s   00:00

注意yarn中的nodeManager实际上就在etc/hadoop目录的slaves文件下，和datanode一样，不用做修改。

[root@node1 hadoop]# vi slaves 
node2
node3

2、启动yarn

    [root@node1 hadoop]# start-yarn.sh
    starting yarn daemons
    starting resourcemanager, logging to /opt/bigdata/hadoop-2.6.5/logs/yarn-root-resourcemanager-node1.out
    node3: starting nodemanager, logging to /opt/bigdata/hadoop-2.6.5/logs/yarn-root-nodemanager-node3.out
    node2: starting nodemanager, logging to /opt/bigdata/hadoop-2.6.5/logs/yarn-root-nodemanager-node2.out

实际上这个命令可以很好的为我们正确的在对应的机器上启动nodeManager,但是我们并没有正确的启动RM，你可以看到使用这条命令启动的RM是在node1上的，确切来讲，node1上也没有启动RM，因为node1启动RM的时候，会去查yarn-site.xml文件，发现RM并没有配置在node1这条机器上，故此会将启动的RM进程杀死，这条命令只是为我们正确的启动了NodeManager。

我们必须要使用手动的方式在node2、node3启动ResourceManager

[root@node2 ~]#  yarn-daemon.sh start resourcemanager
starting resourcemanager, logging to /opt/bigdata/hadoop-2.6.5/logs/yarn-root-resourcemanager-node2.out

启动了之后，可以在node1中使用zk观察到多了一个目录yarn-leader-election

[zk: localhost:2181(CONNECTED) 0] ls /
[zookeeper, yarn-leader-election, hadoop-ha]

我们进入到yarn-leader-election中，查看

    [zk: localhost:2181(CONNECTED) 2] ls /yarn-leader-election 
    [yarncluster1]

发现就是我们在配置文件中yarn.resourcemanager.cluster-id指定的cluster-id。

[zk: localhost:2181(CONNECTED) 7] get /yarn-leader-election/yarncluster1/ActiveStandbyElectorLock 
yarncluster1rm2
cZxid = 0xd00000011
ctime = Sat May 23 11:20:03 CST 2020
mZxid = 0xd00000011
mtime = Sat May 23 11:20:03 CST 2020
pZxid = 0xd00000011
cversion = 0
dataVersion = 0
aclVersion = 0
ephemeralOwner = 0x2000038b7af0001
dataLength = 19
numChildren = 0

通过查看当前yarn集群哪个节点抢到了锁，发现yarncluster1rm2抢到了锁，其中rm2对应的物理节点是node3机器上的RM，故此node3的RM为master节点，node2中的是slaver

可以通过访问node2:8088 和node3:8088 更直观的看到RM运行状态及信息

当我们访问node2:8088 提示：

This is standby RM. Redirecting to the current active RM: http://node3:8088/

当我们访问node3：8088

就可以进入上面的图形界面监控了。注意，当我们点击About就可以看到这个RM节点的详细信息：

在这个界面的链接上，我们改下node2对应的主机地址，就可以看到node2节点的RM信息:

我们还可以点击Nodes，查看RM所管辖的NodeManager节点状态

以上NM都是使用的默认配置，以后需要做修改。

3、MapReduce WordCount实战

首先生成一个文件，里面行格式为hello hadoop $i

[root@node1 ~]# for i in `seq 100000`;do echo "hello hadoop $i" >> data.txt;done

然后在hdfs中生成一个目录

    [root@node1 ~]# hdfs dfs -mkdir -p /data/wc/input

然后上传这个data.txt

    [root@node1 ~]# hdfs dfs -D dfs.blocksize=1048576 -put data.txt /data/wc/input

此时观测到hdfs中的集群是否存在这个文件

然后cd到下面的目录

    [root@node1 mapreduce]# cd
    /opt/bigdata/hadoop-2.6.5/share/hadoop/mapreduce

mapReduce的jar包都在这里。我们看下这个目录的官方提供的mapreduce的案例jar包大小

[root@node1 mapreduce]# ll -h hadoop-mapreduce-examples-2.6.5.jar
-rw-rw-r-- 1 god haizhang 286K Oct  3  2016 hadoop-mapreduce-examples-2.6.5.jar

发现总共大小是286KB，这里面肯定是个分布式程序，比我们期望的大小是不是小很多？这是因为这个案例依赖的很多第三方jar包并不囊括在里面，因为它们已经在hadoop上的每个节点的这个目录下，都已经部署到这些需要依赖的第三方jar包了。故此这个案例的jar包只包含了计算业务逻辑（最终移动的是计算而不是数据，计算jar包小，才移动的快），当然可以很小。如果你还要将第三方jar包一起打包上传，那肯定会很大。

如何在hadoop启动上面官方提供的mapreduce计算程序呢？

可以使用hadoop jar命令，我们看下它的使用格式

[root@node1 mapreduce]# hadoop jar
RunJar jarFile [mainClass] args...

其中mainClass是jarFile里面主程序类，作为一个入口。而args则是传递给主程序类的参数，最常见的就是mapreduce输入（map读取数据文件）路径，输出（reduce输出的文件）路径。注意输出路径一定要是一个hdfs中没有的目录，否则命令启动将报错（为了数据安全，以免reduce输出结果覆盖已有的结果导致其他mapReduce程序报错）。

我们以官方提供的hadoop-mapreduce-examples-2.6.5.jar 中的wordcount应用案例，做一个单词统计的程序运行，来测试mapReduce的工作流程.

键入下面的命令启动mapReduce来运行wordcount计算程序

[root@node1 mapreduce]# hadoop jar hadoop-mapreduce-examples-2.6.5.jar wordcount /data/wc/input /data/wc/output

注意，这里以/data/wc/input作为wordcount程序读取数据的路径，因为/data/wc/input是个目录，将会读取这个目录下的所有一级文件（不会读取这个目录的子目录里的文件）。

而/data/wc/output则为wordcount程序输出结果的目录，需要在hdfs中不存在！

执行命令后，可以看到任务的进展（Progress）以及状态（State）

任务执行完成后：

可以看到运行时的状态，包括：

运行的任务ID
启动这次计算任务的用户（User = root）
行计算程序的名称（Name=wordcount）
计算程序的类型（ApplicationType=MAPREDUCE ,未来也可能是Spark等）
默认的任务队列Queue
任务的启动时间（StarTime）
任务的终止时间（FinishTime）
任务状态（State）
任务最终的执行状态（FinalStatus=SUCCEEDED）

除此之外，命令行也为我们提供了这次任务运行的结果：

查看任务报告

[root@node2 bin]# yarn application -status application_1593950330559_0001
Application Report : 
        Application-Id : application_1593950330559_0001
        Application-Name : mywordcount
        Application-Type : MAPREDUCE
        User : root
        Queue : default
        Start-Time : 1593951525053
        Finish-Time : 1593951633293
        Progress : 100%
        State : FINISHED
        Final-State : SUCCEEDED
        Tracking-URL : http://node3:19888/jobhistory/job/job_1593950330559_0001
        RPC Port : 38515
        AM Host : node3
        Aggregate Resource Allocation : 284829 MB-seconds, 161 vcore-seconds
        Diagnostics :

查看mapreduce log日志

    20/05/23 12:06:24 INFO client.ConfiguredRMFailoverProxyProvider: Failing over to rm2
    20/05/23 12:06:25 INFO input.FileInputFormat: Total input paths to process : 1
    20/05/23 12:06:26 INFO mapreduce.JobSubmitter: number of splits:2
    20/05/23 12:06:26 INFO mapreduce.JobSubmitter: Submitting tokens for job: job_1590204003504_0001
    #yarn客户端向yarn集群提交了个计算任务，任务id为application_1590204003504_0001
    20/05/23 12:06:27 INFO impl.YarnClientImpl: Submitted application application_1590204003504_0001
    #可以根据http://node3:8088/proxy/application_1590204003504_0001/ 追溯这次任务执行流程
    20/05/23 12:06:27 INFO mapreduce.Job: The url to track the job: 
    http://node3:8088/proxy/application_1590204003504_0001/
    20/05/23 12:06:27 INFO mapreduce.Job: Running job: job_1590204003504_0001
    20/05/23 12:06:44 INFO mapreduce.Job: Job job_1590204003504_0001 running in uber mode : false
    # 这里是map在运行时和reduce运行时的进度，发现它们时串行执行的
    20/05/23 12:06:44 INFO mapreduce.Job:  map 0% reduce 0%
    20/05/23 12:07:00 INFO mapreduce.Job:  map 50% reduce 0%
    20/05/23 12:07:04 INFO mapreduce.Job:  map 100% reduce 0%
    20/05/23 12:07:16 INFO mapreduce.Job:  map 100% reduce 100%
    #打印出了这次job任务的执行状态，成功执行。
    20/05/23 12:07:16 INFO mapreduce.Job: Job job_1590204003504_0001 completed successfully
    20/05/23 12:07:16 INFO mapreduce.Job: Counters: 49
    #文件系统的使用情况
            File System Counters
                    FILE: Number of bytes read=1188951
                    FILE: Number of bytes written=2707028
                    FILE: Number of read operations=0
                    FILE: Number of large read operations=0
                    FILE: Number of write operations=0
                    HDFS: Number of bytes read=1893199
                    HDFS: Number of bytes written=788922
                    HDFS: Number of read operations=9
                    HDFS: Number of large read operations=0
                    HDFS: Number of write operations=2
       # 任务运行情况
            Job Counters 
            #使用了2个map程序运行计算分组
                    Launched map tasks=2
                    #使用了1个reduce进行分组数据统计
                    Launched reduce tasks=1
                    Data-local map tasks=2
                    Total time spent by all maps in occupied slots (ms)=30383
                    Total time spent by all reduces in occupied slots (ms)=13508
                    Total time spent by all map tasks (ms)=30383
                    Total time spent by all reduce tasks (ms)=13508
                    Total vcore-milliseconds taken by all map tasks=30383
                    Total vcore-milliseconds taken by all reduce tasks=13508
                    Total megabyte-milliseconds taken by all map tasks=31112192
                    Total megabyte-milliseconds taken by all reduce tasks=13832192
                    # mapReduce框架的一些数据统计
            Map-Reduce Framework
            #map读取的记录条数
                    Map input records=100000
                    #map输出的记录条数
                    Map output records=300000
                    Map output bytes=3088895
                    Map output materialized bytes=1188957
                    Input split bytes=208
                    Combine input records=300000
                    Combine output records=100004
                    Reduce input groups=100002
                    Reduce shuffle bytes=1188957
                    Reduce input records=100004
                    Reduce output records=100002
                    Spilled Records=200008
                    Shuffled Maps =2
                    Failed Shuffles=0
                    Merged Map outputs=2
                    GC time elapsed (ms)=2107
                    CPU time spent (ms)=6220
                    Physical memory (bytes) snapshot=698986496
                    Virtual memory (bytes) snapshot=6448164864
                    Total committed heap usage (bytes)=472907776
                    
                    #mapReduce 拉取执行任务过程中的的异常信息
            Shuffle Errors
                    BAD_ID=0
                    CONNECTION=0
                    IO_ERROR=0
                    WRONG_LENGTH=0
                    WRONG_MAP=0
                    WRONG_REDUCE=0
            File Input Format Counters 
                    Bytes Read=1892991
            File Output Format Counters 
                    Bytes Written=788922

我们查看下mapReduce生成的结果文件

    [root@node1 ~]# hdfs dfs -ls /data/wc/output
    Found 2 items
    -rw-r--r--   2 root supergroup          0 2020-05-23 12:07 /data/wc/output/_SUCCESS
    -rw-r--r--   2 root supergroup     788922 2020-05-23 12:07 /data/wc/output/part-r-00000

发现里面有两个文件，_SUCCESS文件是标志这次任务成功的。

其中part-r-00000 这个文件包含一个”r“ 表示reduce生成的输出文件，当然，也可以只有map输出的文件，如果最终只是map输出的话，这个r就会变成m（也即是part-m-00000）。后面的00000标志着这个是0号reduce输出的文件，如果存在两个reduce，就会分别为它们生成的文件生成对应的序号标志00000、000001 以此类推。

我们查看下/data/wc/output/part-r-00000 文件输出的部分结果:

99985   1
99986   1
99987   1
99988   1
99989   1
9999    1
99990   1
99991   1
99992   1
99993   1
99994   1
99995   1
99996   1
99997   1
99998   1
99999   1
hadoop  100000
hello   100000

源文件中hello 和hadoop是以一个空格隔开，总共有10w行，每行有1个唯一数字，上面的reduce统计结果计算准确。注意，之前我们上传data.txt文件时，是被hdfs以文件块切开两份，数据存储的时候是严格按照字节切分，末尾行和开投行可能出现不完整。但是计算层框架则将不完整的行重新组合成完成的行，再进行计算，往后会介绍如何实现的。

三、使用代码实战mapReduce案例

导入pom依赖

       <dependency>
                <groupId>org.apache.hadoopgroupId>
                <artifactId>hadoop-clientartifactId>
                <version>2.6.5version>
            dependency>

创建mapReduce启动类

    package com.haizhang.hadoop.mapredcue;
    
    import org.apache.hadoop.conf.Configuration;
    import org.apache.hadoop.fs.FileSystem;
    import org.apache.hadoop.fs.Path;
    import org.apache.hadoop.io.IntWritable;
    import org.apache.hadoop.io.Text;
    import org.apache.hadoop.mapreduce.Job;
    import org.apache.hadoop.mapreduce.lib.input.TextInputFormat;
    import org.apache.hadoop.mapreduce.lib.output.TextOutputFormat;
    import java.io.IOException;
    
    public class MyWordCount {
    
        public static void main(String[] args) throws IOException, ClassNotFoundException, InterruptedException {
            Configuration conf = new Configuration(true);
            //获取Job实例，用于提交任务
            Job job = Job.getInstance(conf);
            //必写！这里会根据反射机制来得知你的这个jar包要如何找到入口类，写当前程序的启动类
            job.setJarByClass(MyWordCount.class);
            //随意写，这里标志任务的名称
            job.setJobName("mywordcount");
    
           /* 这两种填写map输入输出文件路径的方式已经淘汰，因为参数固定死只能传path
              不方便于扩展
            job.setInputPath(new Path("in"));
            job.setOutputPath(new Path("out"));
            */
           //传入map的文件路径
            Path in = new Path("/data/wc/input");
            //可以接收多个Path路径，也就是map可以接收多个输入文件来源
            TextInputFormat.addInputPath(job,in);
    //        TextInputFormat.addInputPath(job,in2);
            Path out = new Path("/data/wc/output");
            //注意mapReduce的输出，要求输出目录不存在任何数据，所以先检查是否存在目录，如果存在则递归删除即可。
            FileSystem fs = out.getFileSystem(conf);
            if(fs.exists(out)) fs.delete(out,true);
            TextOutputFormat.setOutputPath(job,out);
    
            //以下配置Map执行程序的逻辑的类
            job.setMapperClass(MyMapper.class);
            //这一要告知map输出给reduce的Key/Vlaue的类型，reduce需要用这个类型进行返程成具体的对象，然后再进行反序列化为该对象赋值
            job.setMapOutputKeyClass(Text.class);
            job.setMapOutputValueClass(IntWritable.class);
            //以下配置Reduce执行程序的逻辑类
            job.setReducerClass(MyReducer.class);
            // Submit the job, then poll for progress until the job is complete
            job.waitForCompletion(true);
        }
    }

还要创建MapReduce中的Map处理类

    package com.haizhang.hadoop.mapredcue;
    import org.apache.hadoop.io.IntWritable;
    import org.apache.hadoop.io.Text;
    import org.apache.hadoop.mapreduce.Reducer;
    import java.io.IOException;
    /**
     * 这个Mapper就是wordCount的实现逻辑
     */
    public class MyMapper extends Mapper<Object, Text, Text, IntWritable> {
    
        /**
         * hadoop框架中，对我们平常用的变量都进行了封装，实现了自己的序列化接口，和比较器接口
         * 比如 int--> IntWritable
         *       String -- > Text
         * hadoop有自己一套可以序列化、反序列化的机制,我们可以自定义类型，不过要实现hadoop提供的
         * 序列化接口（Writable）和比较器接口（Comparable） 也就是  WritableComparable接口。
         **/
        private final static IntWritable one = new IntWritable(1);
        private Text word = new Text();
    
        /**
         *
         * @param key 每行字符串自己第一个字节面向源文件的偏移量,假设文件如下“
         *            hello hadoop 1
         *            hello hadoop 2
         *            则第一行的key为1，第二行的key为16（第一行字符串+空格+换行符+第二行的第一个h）
         * @param value 每行数据
         * @param context 上下文
         * @throws IOException
         * @throws InterruptedException
         */
        public void map(Object key, Text value, Context context) throws IOException, InterruptedException {
            //StringTokenizer使用正则表达式，按照空格/制表符/换行符为分割符，匹配单词。比如hello hadoop 1 则调用
            //itr.nextToken()先得到hello；再次调用  nextToken则得到hadoop 依次类推。
            StringTokenizer itr = new StringTokenizer(value.toString());
            while (itr.hasMoreTokens()) {
                //设置当前匹配到的单词
                word.set(itr.nextToken());
                //往map输出文件写键值对key/value
                context.write(word, one);
            }
        }
    }

最后创建一个MapReduce中的Reduce处理类

    package com.haizhang.hadoop.mapredcue;
    
    import org.apache.hadoop.io.IntWritable;
    import org.apache.hadoop.io.Text;
    import org.apache.hadoop.mapreduce.Mapper;
    
    import java.io.IOException;
    import java.util.StringTokenizer;
    public class MyReducer extends Reducer<Text, IntWritable, Text, IntWritable> {
        //每组key统计的结果是IntWritable类型。表示单词对应的统计总数
        private IntWritable result = new IntWritable();
    
        /**
         * reduce计算方法
         * @param key  map文件输出的Key，也就是分组key
         *             例如reduce计算拉取的分组如下
         *              hello 1
         *              hello 1
         *              hello 1
         *              hello 1
         *              hello 1
         *             则Key就是hello，以hello为分组
         * @param values  每个分组所对应的value列表，如上的列子，values=[1,1,1,1,1] 当然values是个迭代器。
         * @param context 上下文，做最终key/value对的记录输出
         * @throws IOException
         * @throws InterruptedException
         */
        public void reduce(Text key, Iterable<IntWritable>values,
                           Context context) throws IOException, InterruptedException {
            int sum = 0;
            for (IntWritable val : values) {
                sum += val.get();
            }
            result.set(sum);
            context.write(key, result);
        }
    }

上面的注解已经写的很清楚了，这就实现了使用mapReduce进行wordCount计算的小列子。

当所有工作代码写完后，我们就可以使用mvn打jar包

E:\idea代码\hdfs>mvn clean install -Dmaven.test.skip=true

然后将jar上传到node1节点上。并使用下面的命令运行

    [root@node1 ~]# hadoop jar hdfs-1.0-SNAPSHOT.jar com.haizhang.hadoop.mapredcue.MyWordCount

这里不需要附带输入文件输出文件的地址，因为程序jar已经写死了，当然我们可以修改jar，让它接收用户传入的地址

运行完成之后，同样可以用下面命令查看输出的结果是否和预期一样

[root@node1 ~]# hdfs dfs -ls /data/wc/output
Found 2 items
-rw-r--r--   2 root supergroup          0 2020-05-23 19:14 /data/wc/output/_SUCCESS
-rw-r--r--   2 root supergroup     788922 2020-05-23 19:14 /data/wc/output/part-r-00000
[root@node1 ~]# date
Sat May 23 19:16:24 CST 2020
[root@node1 ~]# hdfs dfs -cat /data/wc/output/part-r-00000 | tail -10
99992   1
99993   1
99994   1
99995   1
99996   1
99997   1
99998   1
99999   1
hadoop  100000
hello   100000

经过校验，数据正确！

你可能感兴趣的:(Hadoop-MapReduce-Yarn集群搭建)

opendronemap集群搭建 Robber2000 云计算容器运维云原生
需求OpenDroneMap（ODM）是一个开源项目，旨在利用无人机采集的图像数据生成地图、模型和其他地理空间数据。它主要解决以下问题：航空摄影数据处理：ODM可以处理无人机拍摄的大量航空图像数据，通过图像处理和计算机视觉技术生成高质量的地图和模型。地图制作与更新：利用ODM，用户可以快速、成本效益地生成地图，并及时更新地理空间数据，有助于城市规划、灾害监测等领域的应用。三维建模：ODM可以生成精
Hbase集群搭建超详细教程笑看风云路集群搭建系列 hbase hbase hadoop 大数据
Hbase集群搭建前言详细步骤1、下载安装包2、解压3、修改配置文件3.1修改hbase-env.sh文件3.2修改hbase-site.xml3.3修改regionservers文件4、分发hbase目录5、启动HBase集群6、查看HBaseWebUI大家好，我是风云，欢迎大家关注我的博客，在未来的日子里我们一起来学习大数据相关的技术，一起努力奋斗，遇见更好的自己！前言HBase是一个开源的、
区块链学习Day01 宝哥的菜鸟之路区块链学习
学习前的知识储备1.go语言（必须掌握）2.数据库基本操作3.基本算法4.Linux基本操作5.Linux集群搭建6.Web常识Pow工作量证明一、概念的介绍1.P2P区块链有一个前提，就是P2P，这并非是借贷平台，而是指对等网络.中本聪白皮书：需要第三方支持的点对点电子现金支付系统是没有价值的所谓对等网络（P2P网络），其初衷便站在了这种第三方和中心的对立面在对等网络里，没有特殊的节点，所有节点
springcloud-nacos 配置中心和集群搭建 momo_128 java spring cloud spring 后端
SpringCloudNacos配置中心是一个用于管理和存储应用程序配置信息的服务。它提供了集中式的配置管理、动态配置更新、配置版本控制等功能，使得应用程序可以在运行时获取到最新的配置信息。要搭建SpringCloudNacos配置中心，你可以按照以下步骤进行操作：下载并安装Nacos：首先，你需要从Nacos的官方网站下载Nacos服务器的二进制文件，并将其解压到合适的目录。启动Nacos服务器
Zabbix HA高可用集群搭建 KK小草莓 zabbix
ZabbixHA高可用集群搭建ZabbixHA高可用集群搭建一、Zabbix高可用集群（ZabbixHA）二、部署Zabbix高可用集群1、两个服务端配置1.1主节点ZabbixServer配置1.2备节点ZabbixServer配置1.3主备节点添加监控主机1.4查看高可用集群状态2、两个客户端配置2.1修改agent01和agent02的配置文件2.2查看web页面3、故障模拟和效果测试3.1
Elasticsearch单机集群搭建 dafengyiba
第一步：下载解压官网下载elasticsearch安装包：下载地址创建一个elasticsearch的路径/usr/local/tools/elasticsearch解压tar-xzvfelasticsearch-7.5.0-linux-x86_64.tar.gz重命名mvelasticsearch-7.5.0elasticsearch-7.5.0-node-1创建好三个节点，如下图：image.
【k8s概念】一文搞懂k8s核心概念！！！我是小bā吖 k8s kubernetes 运维 docker 云原生
文章目录1.k8s简介1.1k8s概念1.2作用/功能2.k8s集群搭建方式3.k8s核心组件3.1MasterNode（控制平面组件）3.2WorkerNode4.k8s核心概念4.1容器4.2工作负载——Pod4.3Pod控制器4.3.1ReplicationController(RC)4.3.2ReplicaSet(RS)4.3.3Deployment4.3.4HorizontalPodAu
【Redis快速入门】Redis三种集群搭建配置（主从集群、哨兵集群、分片集群）落798. Redis入门到实战 redis notepad++数据库
个人名片：作者简介：一名大三在校生，喜欢AI编程‍❄️个人主页：落798.个人WeChat：hmmwx53️系列专栏：️零基础学Java——小白入门必备重识C语言——复习回顾计算机网络体系———深度详讲HCIP数通工程师-刷题与实战微信小程序开发——实战开发HarmonyOS4.0应用开发实战——实战开发Redis快速入门到精通——实战开发每日一句：我很忙，但我要忙的有意义！欢迎评论点赞收藏加关注
Redis哨兵模式钗头风 Redis redis 数据库缓存
一.哨兵的作用及工作原理1.哨兵的作用2.哨兵监测集群的方式3.master宕机后哨兵如何从众多slave中选举一个slave作为新的master4.哨兵如何实现故障转移5.总结二.哨兵集群搭建1.架构模式2.搭建流程说明：搭建哨兵集群只需2步第一：搭建一个Redis主从集群;第二：搭建哨兵去监控集群;1.资源配置IP端口角色192.168.157.1306379master192.168.157
FastDFS 分布式集群搭建详解程序员大佬超 FastDFS 分布式 FastDFS fdfs
文章目录前言1、整体架构2、安装配置FastDFS集群2.1配置tracker2.2配置storage3、启动集群4、查看集群情况5、nginx配置5.1配置storage的四台机器的nginx5.2配置tracker的两台机器的nginx5.3配置统一入口前言阅读本文章之前请先看上一篇单机版FastDFS安装配置详解，所以本文有些内容我就一笔带过，传送门：《FastDFS环境搭建及使用详解》1、
ETCD集群代码添加节点 RickJay
集群搭建下面只用同一台服务器进行三个成员节点的开启节点1./etcd--namecd0--initial-advertise-peer-urlshttp://127.0.0.1:2380--listen-peer-urlshttp://127.0.0.1:2380--listen-client-urlshttp://127.0.0.1:2379--advertise-client-urlshttp
SpringCloud之Nacos用法笔记 Gunalaer springcloud spring cloud 笔记 spring
SpringCloud之Nacos注册中心Nacos注册中心nacos启动服务注册到Nacosnacos服务分级模型NacosRule负载均衡策略根据集群负载均衡加权负载均衡Nacos环境隔离-namespaceNacos与eureka的对比临时实例与非临时实例设置Nacos配置管理统一配置管理微服务配置拉取配置自动刷新远端配置共享Nacos集群搭建初始化数据库下载nacos配置nacos启动ng
hadoop 分布式集群安装与原理海牛大数据_青牛老师
对很多人来说，学习大数据都止步于集群搭建，即使是那些工作过很多年的JAVA程序员也不例外，我们分享一套能让您轻松完成集群搭建的方法，包括Hadoop的源码编译、企业级环境安装与配置和常用大数据组件的基本原理，请点击下面连接按笔记顺序进行学习服务器基础环境批量操作多台服务器zookeeper编译hadoop源码高可用（HA）HDFS安装HDFS原理以及常用命令yarn原理以及日常使用
dockerer-compose搭建单机clickhouse集群，工作中最新亲测能用，超详细迷梦星河服务及集群搭建大数据 docker linux java clickhouse
公司这几天让我搭建clickhouse集群，这一周我在公司的角色更像是运维人员搭建集群和服务，一个字干,另外kafka搭建点击这篇，zookeeper集群搭建点击这篇。对于集群搭建来说使用docker来搭建更加方便，这里使用docker-compose来搭建clickhouse集群。由于我自己就一台服务器，那就在一台搭个三分片三副本的集群，这里分二个阶段：准备阶段、搭建阶段。1、准备阶段：连接客户
Zookeeper学习系列【二】Zookeeper 集群章节之集群搭建 Richard_易
前言同道们，好久不见，上一章中，我主要讲了Zookeeper的一些基础的知识点。数据模型+原语集+Watches机制。本章内容主要讲的是集群搭建相关的知识。本篇的内容主要包含以下几点：Zookeeper运行模式Zookeeper搭建一、Zookeeper运行模式Zookeeper有两种运行模式，单点模式和集群模式。单点模式（standalonemode）-Zookeeper只运行在单个服务器上，常
Flink第二篇：集群搭建菜鸟Coders
Flink集群搭建.Flink可以选择的部署方式有：Local、Standalone（资源利用率低）、Yarn、Mesos、Docker、Kubernetes、AWS。我们主要对Standalone模式和Yarn模式下的Flink集群部署进行分析。Standalone模式安装(提示：您需要准备三台已经搭建好的集群，具备jdk，ssh免密登录等配置)我们对standalone模式的Flink集群进行
第三节 zookeeper基础应用与实战2 做个专注的工程师 #zookeeper zookeeper 分布式云原生
目录1.Watch事件监听1.1一次性监听方式：Watcher1.2Curator事件监听机制2.事务&异步操作演示2.1事务演示2.2异步操作3.Zookeeper权限控制3.1zk权限控制介绍3.2Scheme权限模式3.3ID授权对象3.4Permission权限类型3.5在控制台实现操作3.6Curator演示ACL的使用4.Zookeeper集群搭建4.1搭建要求4.2Zookeeper
Hadoop-MapReduce-Yarn集群搭建 qq_2368521029
搭建的部署节点图如下：hdfs和yarn是两个不同概念，两者搭建不会冲突。注意一点是DataNode和NodeManager必须要部署在同一台机器，它们的比例是1比1关系的。否则DataNode只能存储，不能做相应的计算处理。通过官网搭建：hadoop.apache.org/docs/r2.6.5/hadoop-project-dist/hadoop-common/SingleCluster.ht
mysql数据库的pxc工具_CentOS7 下 MySQL 数据库 PXC 集群部署操作指导郑默默 mysql数据库的pxc工具
背景最近在进行MySQL的PXC集群搭建使用和研究前期已完成了一篇记录文章：【CentOS7下MySQL之PXC集群部署【Docker+多机多节点】】但是，毕竟不是所有人都熟悉docker而作为开发人员，还是习惯于原生状态的安装流程所以，在此整理官方指导的PXC集群配置步骤欢迎指摘…【注】：PerconaXtraDBCluster(简称PXC集群)——业界主流的MySQL集群方案环境CentOS版
ClickHouse集群搭建及ODBC配置
ClickHouse是一种列式数据库管理系统，适用于在线分析处理(OLAP)场景。以下是搭建ClickHouse集群及配置ODBC的步骤。首先是ClickHouse集群的搭建。假设你有三台服务器，IP分别为192.168.1.1，192.168.1.2，192.168.1.3。在每台服务器上安装ClickHouse，可通过APT或YUM进行安装，具体命令为：sudoapt-getinstallcl
k8s 集群搭建 1.18.0 dyyy_li
主从结构master：10.19.37.76workder：10.19.37.7510.19.37.77详细步骤所有操作都在root用户下运行。1.初始准备确保集群间机器互相ping通关闭selinux：sed-i's/enforcing/disabled/'/etc/selinux/configsetenforce0关闭swap：swapoff-a#临时vim/etc/fstab#永久2.安装d
DolphinScheduler-3.2.0 集群搭建爱吃辣条byte 任务调度大数据数据仓库
本篇文章主要记录DolphinScheduler-3.2.0集群部署流程。注：参考文档：DolphinScheduler-3.2.0生产集群高可用搭建_dophinscheduler3.2.0使用说明-CSDN博客文章浏览阅读1.1k次，点赞25次，收藏23次。DolphinScheduler-3.2.0生产集群高可用搭建，DolphinScheduler原数据存储mysql设置，分布式存储采用h
k8s，1.14.2 集群搭建（3）：metric server Java程序员YY
简介如何查看pod的CPU,内存等资源占用情况？那就需要metricserver。借用官网的例子使用kubectltop命令查看mem-example中memory-demo的资源使用情况。kubectltoppodmemory-demo--namespace=mem-example结果类似如下：NAMECPU(cores)MEMORY(bytes)memory-demo162856960安装运行
Ubuntu搭建计算集群 xk6891 ubuntu linux 运维
计算机硬件和技术的发展使得高性能模拟和计算在生活和工作中的作用逐渐显现出来，无论是计算化学，计算物理和当下的人工智能都离不开高性能计算。笔者工作主要围绕计算化学和物理开展，亦受限于自身知识和技术所限，文中只是浅显地尝试了整个搭建工作的步骤，很多细节没有深入，还望大家多指导，参考《计算化学集群构建入门》张鋆博士。同时集群搭建可以分为硬件和软件两部分，硬件可以参考北京科音自然科学研究中心内容，这里仅是
redis集群搭建角角_d216
redis集群搭建在开始redis集群搭建之前，我们先简单回顾一下redis单机版的搭建过程下载redis压缩包，然后解压压缩文件；进入到解压缩后的redis文件目录（此时可以看到Makefile文件），编译redis源文件；把编译好的redis源文件安装到/usr/local/redis目录下，如果/local目录下没有redis目录，会自动新建redis目录；进入/usr/local/redi
centos7搭建集群过程妖怪书生 linux新手学习 linux hadoop centos
集群搭建过程第一步：ping测试第二步：修改主机名第三步：修改IP地址与域名映射关系第四步：重启reboot第五步：关闭防火墙第六步：关闭SELinux第七步:免密登录第八步：时钟同步第九步：安装JDK第十步：安装MySQL第十一步：重新设置密码的步骤第十二步：配置Zookeeper集群搭建过程第一步：ping测试复制三台机器，分别为node01，node02，node03按照我们之前学习的，将I
Zookeeper集群搭建（3台）在下区区俗物 zookeeper linux 分布式
准备工作1、提前安装好hadoop102、hadoop103、hadoop104三台机器，参照：CentOS7集群环境搭建（3台）-CSDN博客2、提前下载好Zookeeper安装包并上传到/opt/software上、安装包，链接：https://pan.baidu.com/s/1Ta9DH6FHm2pO4vQw_5wC4A?pwd=6666安装Zookeeper一、解压安装1、解压Zookee
k8s1.20 搭建-抛弃docker使用containerd 玄德公笔记 #02-k8s集群安装 k8s kubernetes 容器运维 k8s集群安装
前言：k8s动不动就要抛弃docker，好吧，让我们体验一下没有docker的k8s。其他相关文档：《k8s-1.21高可用集群搭建》文章目录前言：1.环境准备1.1关闭无用服务1.2环境和网络1.3依赖安装1.4系统优化2.安装Containerd2.1安装2.2修改配置文件2.3启动2.4测试3.k8s集群安装3.1安装服务3.2master初始化3.2.1初始化文件3.2.3下载镜像（非必要
Docker Swarm集群仓库和可视化管理水步天服务器环境搭建 docker 容器运维
DockerSwarm集群仓库和可视化管理1背景2环境3安装操作3.1registary部署3.1.1下载3.1.2部署3.2portainer部署3.2.1下载3.2.2部署1背景本篇是上篇《DockerSwarm集群搭建》的延续篇，上篇中搭建好我们的容器编排集群，日常操作的时候需要使用命令行进行操作，多有不便，所以我们需要使用到一些可视化的工具，Docker图形化管理提供了很多工具，有Port
K8s环境下rook-v1.13.3部署Ceph-v18.2.1集群 @TangXin Ceph Kubernetes kubernetes ceph rook
文章目录1.K8s环境搭建2.Ceph集群部署2.1部署RookOperator2.2镜像准备2.3配置节点角色2.4部署operator2.5部署Ceph集群2.6强制删除命名空间2.7验证集群3.Ceph界面1.K8s环境搭建参考：CentOS7搭建k8s-v1.28.6集群详情，把K8s集群完成搭建，再进行Ceph集群搭建2.Ceph集群部署2.1部署RookOperator#下载rook项
关于旗正规则引擎规则中的上传和下载问题何必如此文件下载压缩 jsp 文件上传
文件的上传下载都是数据流的输入输出，大致流程都是一样的。一、文件打包下载 1.文件写入压缩包 string mainPath="D:\upload\"; 下载路径 string tmpfileName=jar.zip; &n
【Spark九十九】Spark Streaming的batch interval时间内的数据流转源码分析 bit1129 Stream
以如下代码为例（SocketInputDStream）： Spark Streaming从Socket读取数据的代码是在SocketReceiver的receive方法中，撇开异常情况不谈(Receiver有重连机制，restart方法，默认情况下在Receiver挂了之后，间隔两秒钟重新建立Socket连接)，读取到的数据通过调用store(textRead)方法进行存储。数据
spark master web ui 端口8080被占用解决方法 daizj 8080 端口占用 spark master web ui
spark master web ui 默认端口为8080，当系统有其它程序也在使用该接口时，启动master时也不会报错，spark自己会改用其它端口，自动端口号加1，但为了可以控制到指定的端口，我们可以自行设置，修改方法： 1、cd SPARK_HOME/sbin 2、vi start-master.sh 3、定位到下面部分
oracle_执行计划_谓词信息和数据获取周凡杨 oracle 执行计划
oracle_执行计划_谓词信息和数据获取(上) 一：简要说明在查看执行计划的信息中，经常会看到两个谓词filter和access，它们的区别是什么，理解了这两个词对我们解读Oracle的执行计划信息会有所帮助。简单说，执行计划如果显示是access，就表示这个谓词条件的值将会影响数据的访问路径（表还是索引），而filter表示谓词条件的值并不会影响数据访问路径，只起到
spring中datasource配置 g21121 dataSource
datasource配置有很多种，我介绍的一种是采用c3p0的，它的百科地址是： http://baike.baidu.com/view/920062.htm  <bean name="propertiesConfig" class="org.springframework.b
web报表工具FineReport使用中遇到的常见报错及解决办法（三）老A不折腾 finereport FAQ 报表软件
这里写点抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、repeated column width is largerthan paper width：这个看这段话应该是很好理解的。比如做的模板页面宽度只能放
mysql 用户管理墙头上一根草 linux mysql user
1.新建用户 //登录MYSQL@>mysql -u root -p@>密码//创建用户mysql> insert into mysql.user(Host,User,Password) values(‘localhost’,'jeecn’,password(‘jeecn’));//刷新系统权限表mysql>flush privileges;这样就创建了一个名为：
关于使用Spring导致c3p0数据库死锁问题 aijuans spring Spring 入门 Spring 实例 Spring3 Spring 教程
这个问题我实在是为整个 springsource 的员工蒙羞如果大家使用 spring 控制事务，使用 Open Session In View 模式， com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.
百度词库联想 annan211 百度
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> <title>RunJS</title&g
int数据与byte之间的相互转换实现代码百合不是茶位移 int转byte byte转int 基本数据类型的实现
在BMP文件和文件压缩时需要用到的int与byte转换,现将理解的贴出来; 主要是要理解;位移等概念 http://baihe747.iteye.com/blog/2078029 int转byte; byte转int; /** * 字节转成int,int转成字节 * @author Administrator *
简单模拟实现数据库连接池 bijian1013 java thread java多线程简单模拟实现数据库连接池
简单模拟实现数据库连接池实例1： package com.bijian.thread; public class DB { //private static final int MAX_COUNT = 10; private static final DB instance = new DB(); private int count = 0; private i
一种基于Weblogic容器的鉴权设计 bijian1013 java weblogic
服务器对请求的鉴权可以在请求头中加Authorization之类的key，将用户名、密码保存到此key对应的value中，当然对于用户名、密码这种高机密的信息，应该对其进行加砂加密等，最简单的方法如下： String vuser_id = "weblogic"; String vuse
【RPC框架Hessian二】Hessian 对象序列化和反序列化 bit1129 hessian
任何一个对象从一个JVM传输到另一个JVM，都要经过序列化为二进制数据(或者字符串等其他格式，比如JSON)，然后在反序列化为Java对象，这最后都是通过二进制的数据在不同的JVM之间传输(一般是通过Socket和二进制的数据传输)，本文定义一个比较符合工作中。 1. 定义三个POJO Person类 package com.tom.hes
【Hadoop十四】Hadoop提供的脚本的功能 bit1129 hadoop
1. hadoop-daemon.sh 1.1 启动HDFS ./hadoop-daemon.sh start namenode ./hadoop-daemon.sh start datanode 通过这种逐步启动的方式，比start-all.sh方式少了一个SecondaryNameNode进程，这不影响Hadoop的使用，其实在 Hadoop2.0中，SecondaryNa
中国互联网走在“灰度”上 ronin47 管理灰度
中国互联网走在“灰度”上（转）文/孕峰第一次听说灰度这个词，是任正非说新型管理者所需要的素质。第二次听说是来自马化腾。似乎其他人包括马云也用不同的语言说过类似的意思。灰度这个词所包含的意义和视野是广远的。要理解这个词，可能同样要用“灰度”的心态。灰度的反面，是规规矩矩，清清楚楚，泾渭分明，严谨条理，是决不妥协，不转弯，认死理。黑白分明不是灰度，像彩虹那样
java-51-输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。 bylijinnan java
public class PrintMatrixClockwisely { /** * Q51.输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。例如：如果输入如下矩阵： 1 2 3 4 5 6 7 8 9
mongoDB 用户管理开窍的石头 mongoDB用户管理
1:添加用户第一次设置用户需要进入admin数据库下设置超级用户（use admin） db.addUsr({user:'useName',pwd:'111111',roles:[readWrite,dbAdmin]}); 第一个参数用户的名字第二个参数
[游戏与生活]玩暗黑破坏神3的一些问题 comsci 生活
暗黑破坏神3是有史以来最让人激动的游戏。。。。但是有几个问题需要我们注意玩这个游戏的时间，每天不要超过一个小时，且每次玩游戏最好在白天结束游戏之后，最好在太阳下面来晒一下身上的暗黑气息，让自己恢复人的生气 &nb
java 二维数组如何存入数据库 cuiyadll java
using System; using System.Linq; using System.Text; using System.Windows.Forms; using System.Xml; using System.Xml.Serialization; using System.IO; namespace WindowsFormsApplication1 {
本地事务和全局事务Local Transaction and Global Transaction(JTA) darrenzhu java spring local global transaction
Configuring Spring and JTA without full Java EE http://spring.io/blog/2011/08/15/configuring-spring-and-jta-without-full-java-ee/ Spring doc -Transaction Management http://docs.spring.io/spri
Linux命令之alias - 设置命令的别名，让 Linux 命令更简练 dcj3sjt126com linux alias
用途说明设置命令的别名。在linux系统中如果命令太长又不符合用户的习惯，那么我们可以为它指定一个别名。虽然可以为命令建立“链接”解决长文件名的问题，但对于带命令行参数的命令，链接就无能为力了。而指定别名则可以解决此类所有问题【1】。常用别名来简化ssh登录【见示例三】，使长命令变短，使常用的长命令行变短，强制执行命令时询问等。常用参数格式：alias 格式：ali
yii2 restful web服务[格式响应] dcj3sjt126com PHP yii2
响应格式当处理一个 RESTful API 请求时，一个应用程序通常需要如下步骤来处理响应格式：确定可能影响响应格式的各种因素，例如媒介类型，语言，版本，等等。这个过程也被称为 content negotiation。资源对象转换为数组，如在 Resources 部分中所描述的。通过 [[yii\rest\Serializer]]
MongoDB索引调优（2）——[十] eksliang mongodb MongoDB索引优化
转载请出自出处：http://eksliang.iteye.com/blog/2178555 一、概述上一篇文档中也说明了，MongoDB的索引几乎与关系型数据库的索引一模一样，优化关系型数据库的技巧通用适合MongoDB，所有这里只讲MongoDB需要注意的地方二、索引内嵌文档可以在嵌套文档的键上建立索引，方式与正常
当滑动到顶部和底部时，实现Item的分离效果的ListView gundumw100 android
拉动ListView，Item之间的间距会变大，释放后恢复原样； package cn.tangdada.tangbang.widget; import android.annotation.TargetApi; import android.content.Context; import android.content.res.TypedArray; import andr
程序员用HTML5制作的爱心树表白动画 ini JavaScript jquery Web html5 css
体验效果：http://keleyi.com/keleyi/phtml/html5/31.htmHTML代码如下： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"><head><meta charset="UTF-8" > <ti
预装windows 8 系统GPT模式的ThinkPad T440改装64位 windows 7旗舰版 kakajw ThinkPad 预装改装 windows 7 windows 8
该教程具有普遍参考性，特别适用于联想的机器，其他品牌机器的处理过程也大同小异。该教程是个人多次尝试和总结的结果，实用性强，推荐给需要的人！缘由小弟最近入手笔记本ThinkPad T440，但是特别不能习惯笔记本出厂预装的Windows 8系统，而且厂商自作聪明地预装了一堆没用的应用软件，消耗不少的系统资源（本本的内存为4G，系统启动完成时，物理内存占用比
Nginx学习笔记 mcj8089 nginx
一、安装nginx 1、在nginx官方网站下载一个包，下载地址是： http://nginx.org/download/nginx-1.4.2.tar.gz 2、WinSCP(ftp上传工
mongodb 聚合查询每天论坛链接点击次数 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 18 */ { "_id" : ObjectId("5596414cbe4d73a327e50274"), "msgType" : "text", "sendTime" : ISODate("2015-07-03T08:01:16.000Z"
java术语（PO/POJO/VO/BO/DAO/DTO） Luob. DAO POJO DTO po VO BO
PO(persistant object) 持久对象在o/r 映射的时候出现的概念,如果没有o/r映射,就没有这个概念存在了.通常对应数据模型(数据库),本身还有部分业务逻辑的处理.可以看成是与数据库中的表相映射的java对象.最简单的PO就是对应数据库中某个表中的一条记录,多个记录可以用PO的集合.PO中应该不包含任何对数据库的操作. VO(value object) 值对象通
算法复杂度 Wuaner Algorithm
Time Complexity & Big-O： http://stackoverflow.com/questions/487258/plain-english-explanation-of-big-o http://bigocheatsheet.com/ http://www.sitepoint.com/time-complexity-algorithms/

Hadoop-MapReduce-Yarn集群搭建

一 、MapReduce on Yarn单节点搭建

二、搭建高可用的yarn

三、使用代码实战mapReduce案例

你可能感兴趣的:(Hadoop-MapReduce-Yarn集群搭建)

一、MapReduce on Yarn单节点搭建