十一、Hadoop HDFS Java API操作

使用HDFS Java API可以远程对HDFS系统中的文件进行新建、删除、读取等操作。本节主要介绍如何在Eclipse中使用HDFS Java API与HDFS文件系统进行交互。

在使用Java API之前,首先需要新建一个Hadoop项目。Hadoop项目的结构与普通的Java项目一样,只是所需依赖包不同。

导入依赖库

在Eclipse(或IDEA)中新建一个Maven项目 “hdfs_demo”(Maven项目的搭建此处不做过多讲解),然后在该项目的pom.xml文件中添加以下代码,以引入Hadoop的Java API依赖包:



   org.apache.hadoop

   hadoop-client

   3.3.1

配置好pom.xml后,即可使用HDFS Java API进行程序的编写。

读取数据

FileSystem是HDFS Java API的核心工具类,该类是一个抽象类

你可能感兴趣的:(#,hadoop,java,hdfs,hdfs,java,API)