Hadoop复习(十)

Sqoop数据迁移

问题 1 判断题

2 / 2 分

实现数据导出操作时,需要提前在关系数据库创建对应的数据表

正确

错误

问题 2 判断题

2 / 2 分

Sqoop利用MapReduce实现数据导入时可以不涉及Reduce Task的处理

正确

错误

问题 3 单项选择

2 / 2 分

Sqoop底层使用_____实现数据的导入与导出

MapReduce

Spark

HivesQL

SQL

问题 4 单项选择

2 / 2 分

Sqoop主要用于在_____和______之间传输数据

Hadoop 关系数据库

Hadoop HBase

HBase 关系数据库

HDFS 关系数据库

问题 5 判断题

2 / 2 分

数据导入是指通过Sqoop将Hadoop的数据导入关系数据库

正确

错误



简述Sqoop实现数据导入的原理

1.客户端向Sqoop发送数据导入的命令 2.Sqoop通过JDBC连接关系数据库,获取所有表的元数据信息,元数据信息包含字段和字段的数据类型,并将字段的数据类型映射为java支持的数据类型,如将字段的数据类型Varchar映射为java支持的数据类型String 3.Sqoop根据获取得元数据信息生成一个与表同名的记录容器类以完成序列化操作,记录表的每行数据。 4.sqoop根据生成得记录容器类启动一个MapReduce程序。 5.MapReduce程序可以通过多个MapTask进行并行计算,从关系数据库的表中读取数据,这时会使用Sqoop生成得记录容器类进行反序列化操作 6.MapReduce程序可以通过多个MapTask进行并行计算,将关系数据库读取的数据加载到HDFS、Hive表、或HBase表,这时同样的会使用Sqoop生成得记录容器类进行反序列化的操作

你可能感兴趣的:(hadoop,大数据,分布式)