大数据华为认证考试(试卷编号111)
1.[单选题]表设计时选择分布列的原则包括:( )。
A)作为分布列的字段尽量聚集
B)选择查询中关联条件作为分布列
C)尽量选择在查询中存在形如col=10001过滤条件的字段
答案:B
解析:
2.[单选题]hdfs dfs命令中的-get和-put命令操作对象是()
A)文件
B)目录
C)两者都是
答案:C
解析:
3.[单选题]要级联删除用户创建的表等数据库对象,使用关键字( )。
A)STRICT
B)CASCADE
C)USAGE
答案:B
解析:
4.[单选题]Fl
ink 不包含以下哪些数据处理场景?()
A)高可靠性
B)图形分析
C)毫秒级低时延
D)高并发
答案:B
解析:
5.[单选题]以下属于 Hive 的架构组件的是?()
A)H Log
B)Driver
C)H master
D)Name Node
答案:B
解析:
6.[单选题]Zookeeper在分布式应用中的主要作用不包括:( )选项。
A)选举Master节点
B)保证各节点上数据的一致性
C)分配集群资源
D)存储及群中服务器信息
答案:C
解析:
7.[单选题]MVCC用于解决( )事务冲突。
A)读读
B)写写
C)读写
D)上述都包括
答案:C
解析:
8.[单选题]在有N个节点Fusio
nInsight HD集群中部署Hba
se时、推荐部署( )个H Master进程,(
)个Region Server进程。
A)3、N
B)N、N
C)2、N
D)2、2
答案:C
解析:
9.[单选题]Hba
se 不支持哪些 SQL 操作?()
A)Hive SQL
B)Spark SQL
C)MySQL
D)Phoenix SQL
答案:C
解析:
10.[单选题]Kafka 中 Co
nsumer 使用什么方式来记录读取位置?(D)
A)时间信息
B)用户信息
C)设备信息
D)偏移量信息
答案:D
解析:
11.[单选题]HDFS客户端所在节点的系统时间与Fusio
ninsight HD集群的系统时间要保持一致,若有
时间差, 那么时间差应小于( )分钟。
A)5
B)10
C)20
D)30
答案:A
解析:
12.[单选题]进行场景迁移的前提条件说法错误的是:( )。
A)该用户必须拥有管理员权限
B)已获取待连接数据源的用户名
C)已获取待连接数据源的密码
D)已获取待连接数据源的地址
答案:A
解析:
13.[单选题]第三次信息化浪潮标志不包含以下哪项?()
A)互联网
B)云计算
C)大数据
D)物联网
答案:A
解析:
14.[单选题]Redis 中 List 列表是什么数据结构实现的?()
A)红黑树
B)循环链表
C)平衡二叉树
D)双向链表
答案:D
解析:
15.[单选题]大数据应用开发流程不包含以下哪项?()
A)需求分析
B)可行性分析
C)应用推广
D)技术选型
答案:C
解析:
16.[单选题]安全Kafka集群中,关于Kafka组的说法错误的是()
A)kafka admin组拥有Topic的所有权限
B)kafka组用户被授予Topic相关权限后,只有使用新API才能访问;
C)Kafka super组用户默认具有所有的Topic的读写权限
D)kafka组用户被授予Topic相关权限后,一定可以访问
答案:D
解析:
17.[单选题]Graph ba
se 能够处理海量数据的原因是什么?()
A)基于 Elasticsearch 的索引机制
B)基于 H ba
se 的分布式存储机制
C)基于 Spark 的分布式内存计算技术
D)图机制特性
答案:B
解析:
18.[单选题]创建存储过程, CREATE OR REPLACE PROCEDURE proc_whi1e_1oop(maxval in