阿里云大数据ACA及ACP复习题(21~40)

21.Hadoop的主要功能中,能完成对海量数据分布式运算的是哪个组件?(D)
A:HDFS
B:DFS
C:RDD
D:MapReduce

解析:MAPREDUCE(分布式运算编程框架)

22.以下选项中不属于MaxCompute特点的是(D)
A:支持多种多种经典的分布式计算模型
B:海量数据存储与计算
C:保障数据安全、降低企业成本
D:处理离线数据不能处理实时数据

解析:MaxCompute向用户提供了完善的数据导入方案以及多种经典的分布式计算模型,能够更快速的解决用户海量数据计算问题,有效降低企业成本,并保障数据安全。 https://help.aliyun.com/document_detail/27800.html

23.智能分析套件Quick Bl是一个专为云上用户是身打造的新—代智能BI服务平台。以下选项属于Quick Bl数据可视化分析平台的优势的是?(ABC)
A:强大的Quick数据引擎
B:快速搭建数据门户
C:智能数据分析和交互
D:安全管控不能设置权限

解析:安全管控设置权限

24.系统日志数据一般是由业务系统在运行过程中产生的,用于记录对数据源的操作,这些操作的记录以(B)的形式进行存储?
A:数据库
B:文本
C:视频
D:弹幕信息

解析:日志数据一般以文本方式存储,以.log结尾的文本文件

25.关系型数据库中,表中的数据是以行和列的形式来存储的,以下选项中关于行与列的特点描述正确的是?(A)
A:同一列数据项具有相同数据类型
B:每一行的列是不固定的
C:行数据的顺序不能任意
D:可以有同名的字段名

解析
任何一列遵循范式,数据项不可再分,同一列数据具有相同的数据类型。 每列字段的数据格式是固定的

26.随着大数据时代的发展,Hadoop生态圈组件越来越丰富。关于Hadoop生态圈组件Flume是(A)的框架。
A:日志收集
B:数据挖掘库
C:分布式文件系统
D:ETL工具

解析:日志收集工具

27.Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。它包含哪些核心模块? (BCE)
A:Hadoop common公共包
B:Hadoop分布式文件系统(HDFS)
C:Hadoop YARN
D:Hadoop的分布式消息统
E:Hadoop MapReduce

解析:Hadoop的核心组件为:HDFS、MapReduce和Yarn。

28.在Spark Streaming工作机制中,集群管理器是哪个组件?(D)
A:Receiver
B:Executor
C:SparkContext
D:Cluster Manager

解析:集群管理器(cluster manager) 包括Hadoop YARN,Apache Mesos,以及Spark自带的一个简易调度器,叫做独立调度器。

29.随着大数据时代的发展,Hadoop生态圈组件越来越丰富。关于Hadoop生态圈组件MapReduce,描述正确的是©
A:工作流引擎
B:数据仓库
C:分布式计算框架
D:列式数据库

解析:分布式计算框架:MapReduce

30.数据总线DataHub服务基于阿里云自研的飞天平台,具有高稳定,低成本,©,高吞吐的特点。
A:高精度
B:高可扩展
C:高集成性
D:高契合

解析:数据总线DataHub服务基于阿里云自研的飞天平台,具有高可用,低延迟,高可扩展,高吞吐的特点。 https://help.aliyun.com/document_detail/47439.html

31.Hadoop底层会维护多个数据副本,当某个节点出现故障后,也不会造成损失。上述文字体现了Hadoop的哪个特点?(C)
A:高效率
B:低成本
C:高可靠
D:高扩展

解析:“当某个节点出现故障后,也不会造成损失”体现了高可靠的特点

32.HBase的服务体系与Hoodoop类似也遵从的是主从结构,以下选项中那个是HBase的主节点(B)
A:HRegionServer
B:HMaster
C:Hregion
D:MemStore

解析:主节点Hmaster

33.大数据的特征,由维克托迈尔-舍恩伯格和肯尼斯克耶编写的《大数据时代》中提出,下哪一个描述大数据的4V特征是错误的?"(C)
A:Volume规模性
B:Velocity数据变化快
C:Value单位数据价值密度高
D:Variety数据类型多

解析:大数据的4v特征主要包含规模性(Volume)、多样性(Variety)、高速性(Velocity)、价值性(Value) Value(价值密度低)

34.在NoSQL类型的数据库中,最适合用于批量处理和即时查询的是什么数据库?(D)
A:关系型数据库
B:文档型数据库
C:图形型数据库
D:列族数据库

解析:列存储:主要适合与批量数据处理和即时查询

35.数据清洗是指检测和纠正错误数据,它清洗的内容包含(ABC)
A:缺失值处理
B:异常值处理
C:数据类型转换
D:精确度检验

解析:数据清洗的内容包括:缺失值处理、数据类型转换、异常值处理以及数据排序

36.智能健康手环数据收集,体现了(D)的数据采集技术的应用。
A:USB数据传输
B:网络数据
C:API接口
D:传感器设备

解析:“智能健康手环”体现了传感器设备的应用

37.Hive的SQL执行流程中Physical Plan Generator的作用是什么?(C)
A:生成查询语句
B:编译SQL语句
C:将逻辑查询计划转化为物理计划
D:分析查询条件

解析:将逻辑查询计划转成物理计划(physical plan generator)

38.在MaxCompute架构中,关于计算引擎说法正确的是(A)
A:MaxCompute能处理离线数据与实时数据是一个流批一体的计算框架
B:MaxCompute计算引擎是依赖Hadoop平台
C:MaxCompute不支持Spark
D:MaxCompute SQL支持事务、索引

解析:链接:https://help.aliyun.com/document_detail/27800.html、 https://help.aliyun.com/document_detail/102357.html 计算引擎 MaxCompute本身具备计算引擎能力。 MaxCompute支持社区原生Spark、完全兼容Spark的API,同时支持多个Spark版本同时运行。 MaxCompute SQL不支持事务、索引。

39.商业上要求个性化推荐算法达到实时推荐的效果,如:某网站刚刚发布的新闻或视频,用户可以在几分钟甚至更短的时间内搜索到。体现了大数据的©特征。
A:Volume规模性
B:Veracity准确性
C:Velocity高速性
D:Varlety多样性
E:Value价值性

解析:“用户可以在很短时间内搜索到”体现了高速性

40.传感器数据源有哪些应用场景? (AC)
A:手机支付宝运动监测运动步数
B:优酷网播放的视频
C:智能穿戴记录睡眠情况
D:ERP系统的存储数据

解析:传感器数据源以OpenTelemetry为核心,支持各类数据形态、设备/端、数据格式的采集,覆盖面足够“广”。

你可能感兴趣的:(阿里云,大数据,云计算)