Hadoop的测试例子WordCount(含效果图)

1、建立三个个测试的目录

先切换到hadoop下,创建input, output, test。

mkdir ./inout

mkdir ./output

mkdir ./test


2、建立测试文件

 vim test.txt

然后输入如下数据

hello hadoop
hello World
Hello Java
Hey man
i am a programmer


3.将测试文件放到测试目录中

bin/hadoop dfs -put ./test/test.txt /hadoop/input



4、执行wordcount程序

# bin/hadoop jar hadoop-examples-1.2.1.jar wordcount /hadoop/input/* /hadoop/output



/hadoop/output目录必须不存在,否则会报错:

org.apache.hadoop.mapred.FileAlreadyExistsException: Output directory /hadoop/output already exists

因为Hadoop执行的是耗费资源的运算,产生的结果默认是不能被覆盖的。

执行成功的话,显示下面的信息:

bin/hadoop jar hadoop-examples-1.2.1.jar wordcount /hadoop/input/* /hadoop/output

Hadoop的测试例子WordCount(含效果图)_第1张图片



然后再端口查看进度。

Hadoop的测试例子WordCount(含效果图)_第2张图片



你可能感兴趣的:(Hadoop的测试例子WordCount(含效果图))