大数据知识练习测试题目

上传人:m**** 文档编号:563713988 上传时间:2023-06-18 格式:DOCX 页数:9 大小:14.58KB
返回 下载 相关 举报
大数据知识练习测试题目_第1页
第1页 / 共9页
大数据知识练习测试题目_第2页
第2页 / 共9页
大数据知识练习测试题目_第3页
第3页 / 共9页
大数据知识练习测试题目_第4页
第4页 / 共9页
大数据知识练习测试题目_第5页
第5页 / 共9页
点击查看更多>>
资源描述

《大数据知识练习测试题目》由会员分享,可在线阅读,更多相关《大数据知识练习测试题目(9页珍藏版)》请在金锄头文库上搜索。

1、大数据知识练习测试题目姓名: 部门: 成绩:1、 用于自动补全功能时,输入命令或文件的前 1 个或后几个字母按什么键( )A、ctrlB、tabC、altD、esc2、vim 退出不保存的命令是。( )。A、:qB、qC、:wqD、:q!3、改变文件的属主的命令是。( )。A、chmodB、touchC、chownD、cat4、Linux 配置文件一般放在什么目录。( )。A、etcB、binC、libD、dev5、如果执行命令,chmod 746 file、txt,那么该文件的权限是()。A、rwxrrw-B、rw-rrC、xrrwxD、rwxrr6、python 中序列类型不包含那一个?(

2、 )。A、字符串B、列表C、元祖D、字典7、python 中单行和多少注释分别是那一个?( )。A、/和 B、#和 C、# 和/D 、/ 和 8、python 中那个数据类型不支持? ( )。A、intB、floatC、charD、list9、python 中,a=round(3、45),请计算出 a 的数值。()。A、 4B、3、4C、4、0D、310、python 中,下面那个关键字用来声明一个函数。( )A、defB、passC、functionD、class11、python 中,那一个不是函数的有点。( )。A、减少代码重复B、程序模块化C、加快程序运行D、提高阅读代码的效率12、下

3、列不是元祖定义方式。( )。A、3B、3,C、3,2D 3,2,1,213、以下哪一项属于非结构化数据。( )。A、数据库服务器日志数据B、企业财务系统数据C、企业摄像头视频监控数据D、 企业 ERP 数据14、 MapReduce编程模型,键值对vkey, value的key必须实现哪个接口?()。A、WritableComparableB、ComparableC、WritableD、LongWritable15、HBase 是分布式列式存储系统,记录按什么集中存放。 ( )。A、行B、行列C、列族D、不确定16、客户端首次查询HBase数据库时,首先需要从哪个表开始查找。()。A、用户表B

4、、- ROOT-C、信息表D、信息表17、HDFS 中的 block 默认保存几个备份。 ( )。A、1 份B、2 份C、3 份D、4 份18、HDFS1、0 默认 Block Size 大小是多少。()。A、32MBB、64MBC、128MBD、256MB19、 将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任 务?( )。A、数据预处理B、分类和预测C、频繁模式挖掘D、数据流挖掘20、 建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值属 于数据挖掘的哪一类任务?( )。A、建模描述B、根据内容检索C、寻找模式和规则D、预测建模21、python 中,那一个不是

5、 python 语言特点。( )。A、python 面向对象B、python 编程有格式要求C、python 比 java 效率高D、python 是人工智能选择的语言。22、Python 不支持的数据类型有( )。A、charB、intC、floatD、list23、以下哪一项属于非结构化数据库( )。A、MysqlB、OracleC、MongoDBD、SqlServer24、以下不是常用数据模型是那一个( )。A、层次模型B、网状模型C、关系模型D、树状模型25. 若一台计算机的内存为128MB,则交换分区的大小通常是()。A、64MBB、128MBC、256MBD、512MB26、下列哪

6、项不可以作为集群的管理 ( )。A、PuppetB、PdshC、Cloudera ManagerD、Zookeeper27、下列哪个不是 Hadoop 运行的模式( )。A、单机版B、伪分布式C、分布式D、局域网模式28、关于大数据的主要特征理解和描述不正确的有( )。A、来源多,格式多B、增长速度快,处理速度快C、存储量大,计算量大D、数据的价值密度较低29、以下不属于数据挖掘方式的是( )。A、自然语言处理B、聚类C、分类D 、 关联规则30、在自然语言处理过程中,把句子拆分成一个个词语的过程被称为( )A、分词B、分解C、切片D、索引 31、( )分布式和集群都是解决大数据解决方案。对错

7、32、( )云计算核心就是本地无法解决的问题提交到计算机网络集群中运算,运用 网络计算机的能力对错33、( )python中可以应用在大数据实时运算,java应用在大数据的推送。对错34、( )数据挖掘可以是很少的数据得到精确的结果,从而给出精准的决策。对错35、()数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行重新综合、对错36、( )Hadoop 默认调度器策略为 FIFO对错37、( )hadoop 支持数据的随机读写。38、( )网络爬虫可以爬取互联网上任意的网页。对错39、( )数据仓库随时间的变化不断增加新的数据内容。对错40、( )超市根据销售纪录发现,买啤酒的顾客有35%概率也会购买儿童尿布,这 种属于数据挖掘的关联规则。对错

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号