华为大数据测试试题及答案

上传人:汽*** 文档编号:558350033 上传时间:2023-05-01 格式:DOCX 页数:20 大小:31.99KB
返回 下载 相关 举报
华为大数据测试试题及答案_第1页
第1页 / 共20页
华为大数据测试试题及答案_第2页
第2页 / 共20页
华为大数据测试试题及答案_第3页
第3页 / 共20页
华为大数据测试试题及答案_第4页
第4页 / 共20页
华为大数据测试试题及答案_第5页
第5页 / 共20页
点击查看更多>>
资源描述

《华为大数据测试试题及答案》由会员分享,可在线阅读,更多相关《华为大数据测试试题及答案(20页珍藏版)》请在金锄头文库上搜索。

1、华为大数据测试试题及答案HCIP_81您的姓名: 填空题 *1. Flume 支持采集静态目录下数据的 source 类型是? 单选题A、http sourceB、spooling directory source(正确答案)C、exec sourceD、syslog source2. 关于Kafka磁盘容量不足的告警,对于可能的原因以下不正确的是?单选题A、用于存储Kafka数据的磁盘配置(如磁盘数目磁盘大小等),无法满足当前业 务数据流量,导致磁盘使用率达到上限B、数据保存时间配置过长,数据累积达到磁盘使用率上限C、业务规划不合理,导致数据分配不均,使部分磁盘达到使用率上限D、Broker

2、节点故障导致(正确答案)3. 查看 Kafka 某 Topic 的 Partition 详细信息时,使用如下哪个命令? 单选题A、bin/kafka-topics.sh -createB、bin/kafka-topics.sh -listC、bin/kafka-topics.sh -deleteD、bin/kafka-topics.sh -describe(正确答案)4. 关于 Kafka 组件部署说法不正确的是? 单选题A、Kafka 强依赖于 ZooKeeper,安装 Kafka 必须安装 ZooKeeperB、Kafka部署的实例个数不得小于2C、Kafka服务端可以产生消息(正确答案)

3、D、Consumer作为Kafka的客户端角色专门进行消息的消费5. 在redis中,下面哪个是操作Hash数据类型的命令?单选题A、strlenB、hexists(正确答案)C、smembersD、Ltrim6. 关于Schema和Database,下面说法正确的是()。单选题A、二者都能实现资源隔离B、schema和用户强相关的,通过权限控制语法可以实现不同用户对各Schema的 权限(正确答案)C、Database之间无法直接访问,但通过权限授予可以访问数据D、相比于Database,Schema的隔离更加的彻底7. 下面哪个数据类型不是 GaussDB 200 支持的数据类型()。 单

4、选题A、XML类型(正确答案)B、数值类型C、JSON类型D、货币类型8. GaussDB 200在创建表时,需要注意以下哪个事项() ? 单选题A、创建列存表时压缩级别默认为LOW(正确答案)B、创建列存表时压缩级别默认为HIGHC、创建列存表时压缩级别默认为NOD、创建列存表之后,后续可以修改为行存表9. 下列关于存储过程的特点说法正确的是()? 单选题A、编写的SQL存储在数据库中,因此执行速度快B、创建时编译,执行时调用,因此开发效率高C、用户创建的存储过程或自定义函数可以重复调用,因此数据传输量少D、通过指定存储过程的访问权限,因此安全系数高(正确答案)10. 下列关于 GaussD

5、B 200的局部聚簇技术说法正确的是()? 单选题A、局部聚簇技术可以应用在GaussDB 200的所有表中B、局部聚簇在某些场景下可以提交检索效率,所以在创建表时根据业务场景应创 建多个PCKC、PCK对应的列尽量不要为空值D、PCK通过min/max稀疏索引实现事实表快速过滤扫描(正确答案)11. 从数据库架构设计来看,主要有以下哪些设计思路? 单选题A、Shard-DiskB、Shard-EveryingC、Shard-NothingD、以上都是(正确答案)12. 语句 number = 0 的意思是()? 单选题A、修改变量number的值为0B、判断number的值是否为0C、比较n

6、umber和0的大小D、声明一个变量number,并初始化值为0(正确答案)13. GaussDB 200支持几种数据并行导入策略? 单选题A、4B、3(正确答案)C、2D、114. ElasticSearch 架构中包含哪些? 单选题A、A.以上说法全都正确(正确答案)B、ClientC、ESMasterD、ESNode15. .以下哪个不是 RDD 的创建方式? 单选题A、从子的RDD转换到新的RDD(正确答案)B、从数据集合转换而来C、从HDFS输入创建D、从父的RDD转换的到新的RDD16. 以下哪个不是 SparkSQL 的使用场景? 单选题A、A.需要处理PB级的大容量数据B、对数

7、据处理的实时性要求不高的场景C、实时数据查询(正确答案)D、结构化数据处理17. 以下哪个不是离线批处理的核心诉求? 单选题A、处理数据量巨大B、处理数据格式多样C、处理时间要求不高(正确答案)D、支持SQL类作业和自定义作业18. HBase架构中包含哪些?单选题A、ZookeeperB、以上说法全都正确(正确答案)C、HmasterD、HRegionServer19. 某项目小组接到一个大数据实时分析项目,且对实时性要求很高。请问以下哪 种大数据计算 框架最合适? 单选题A、HbaseB、MapReduceC、SparkD、Flink(正确答案)20. 以下关于Hive内置函数描述正确的是

8、?单选题A、desc functions upper :查看系统自带的函数B、trim():去除空字符串(正确答案)C、to_date():获取当前日期D、substr():求字符串长度21. Gremlin 中查询单个点的信息该用什么命令? 单选题A、g.V(13464736).valueMap()(正确答案)B、g.V().hasLabel(test).values(age)C、g.V().hasLabel(test)D、g.V().hasLabel(test).valueMap(String_list,age)22. 考虑以下场景,当公安人员需要根据某犯罪人员发现其犯罪同伙时,最适合使用

9、下列哪个工 具? 单选题A、ElasticSearchB、GraphBase(正确答案)C、HbaseD、HDFS23. HBase 使用 get 方法读取数据时,下列哪个选项是需要的? 单选题A、Delete delete = new Delete(rowKey)B、scan.setCaching(lOOO)C、byte rowKey = Bytes.toBytes(012005000201)(正确答案)D、ListvPut puts = new ArrayListvPut()24. Flink不包含以下哪些数据处理场景?单选题A、高并发B、毫秒级低时延C、高可靠性D、图形分析(正确答案)2

10、5. 关于 GaussDB 200的逻辑架构,下列说法正确的是()? 单选题A、DN是实际数据节点,所以只负责存储数据。B、CM是集群的管理模块,那么负责集群的日常管理和运维。C、CN是协调节点,协助CM管理整个集群。D、GTM是全局事务控制器,负责生成和维护全局事务ID等全局唯一信息。(正 确答案)26. 用户 Region 和 Region Server 之间的路由信息,保存在哪个模块中? 单选题A、ZookeeperB、B HDFSC、MasterD、Meta表(正确答案)27. Hbase 的物理存储单元是什么? 单选题A、RegionB、Columnfamily(正确答案)C、Col

11、umnD、Row28. Redis 中适合存储对象的数据类型是? 单选题A、Hash(正确答案)B、ListC、StringD、Set29. GAUSSDB200 数据并行导入 Shared 策略支持的数据格式是? 单选题A、CSVB、Text(正确答案)C、FIXEDD、seq30. Flume 支持第三方过滤器对数据进行过滤操作。 判断题对(正确答案)错31. 多个 Flume 可以连接起来从部署节点上采集数据。 判断题对(正确答案)错32. Flume传输数据时,sink如果出现下一跳故障,可以将数据发给其他的下一 跳。 判断题对(正确答案)错33. Kafka集群中,Kafka服务端角

12、色是Consumer。判断题对错(正确答案)34. Kafka集群中,Kafka部署的实例个数不得小于2。判断题对(正确答案)错35. Checkpoint 机制是 Flink 运行过程中容错的重要手段。 判断题对(正确答案)错36. Flink 程序是由 DataSet 和 DataStream 组成。 判断题对错(正确答案)37. Structured Streaming 的外部存储系统的 Append Mode 方式表示只有在 ResultTable 中被更新的数据才会被写入到外部存储系统。 判断题对错(正确答案)38. Redis 可以做排行榜的应用场景。 判断题对(正确答案)39.

13、Redis 的 flushall 命令表示清空 Redis 实例下所有数据库的数据。 判断题对(正确答案)错40. 数据库架构设计Shard-Everying是指服务器的所有资源(包括磁盘、CPU、显 卡、网络)都共享。 判断题对错(正确答案)41. CTID的值是增量增加的。判断题对(正确答案)错42. 物理集群包含逻辑集群。 判断题对(正确答案)错43. SQL on Anywhere 的意思是 SQL 可以在任何地方使用。 判断题对错(正确答案)44. GaussDB 200 的自适应调度和大数据的 Yarn 调度是类似的,都是根据作业的所 耗资源, 按照作业优先级,并优先满足损耗资源少

14、的作业,保证资源的充分利 用。 判断题对错(正确答案)45. 创建数据库时默认支持的字符集是 UTF-8。 判断题对错(正确答案)46. Flink 程序是由 DataSet 和 DataStream 组成。 判断题对错(正确答案)47. Structured Streaming 的外部存储系统的 Append Mode 方式表示只有在 ResultTable 中被更新的数据才会被写入到外部存储系统。 判断题对错(正确答案)48. .Hive从本地加载数据需要加关键字:“local”判断题对(正确答案)错49. 大数据技术,是指伴随大数据的采集、存储、处理和分析的相关技术 判断题对(正确答案)错50. 针对不同的数据来源,需要先分析其数据特征,例如一般网站产生的日志特点是数据量大,价值密度高,数据的业务种类多且涵盖之前的数据。判断题 对错(正确答案)51. Kafka中的Broker在收到新消息后会立即存入磁盘。判断题 对错(正确答案)52. Gauss

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号