[南开大学]春学期1709、1803、1809、1903大数据导论在线作业

上传人:南京****11 文档编号:130225629 上传时间:2020-04-26 格式:DOCX 页数:14 大小:16.15KB
返回 下载 相关 举报
[南开大学]春学期1709、1803、1809、1903大数据导论在线作业_第1页
第1页 / 共14页
[南开大学]春学期1709、1803、1809、1903大数据导论在线作业_第2页
第2页 / 共14页
亲,该文档总共14页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《[南开大学]春学期1709、1803、1809、1903大数据导论在线作业》由会员分享,可在线阅读,更多相关《[南开大学]春学期1709、1803、1809、1903大数据导论在线作业(14页珍藏版)》请在金锄头文库上搜索。

1、【奥鹏】南开大学19春学期(1709、1803、1809、1903)大数据导论在线作业试卷总分:100 得分:100第1题,IaaS是()的简称A、软件即服务B、平台即服务C、基础设施即服务D、硬件即服务正确答案:C第2题,下面哪一项不是中国发展大数据产业的基础()。A、信息化积累了丰富的数据资源B、大数据技术创新取得明显突破C、大数据应用推动势头良好D、大数据产业支撑薄弱正确答案:D第3题,用于描述数据分散情况的是()A、分布图B、箱式图C、饼图D、折线图正确答案:B第4题,PaaS是()的简称A、软件即服务B、平台即服务C、基础设施即服务D、硬件即服务正确答案:B第5题,GFS中的文件切分

2、成()的块进行存储A、32MBB、64MBC、128MBD、1G正确答案:B第6题,大数据的最显著特征是() 。A、数据规模大B、数据类型多样C、数据处理速度快D、数据价值密度高正确答案:A第7题,SAN是一种()A、存储设备B、专为数据存储而设计构建的网络C、光纤交换机D、HBA正确答案:B第8题,用于描述相等时间间隔下连续数据随时间变化趋势的是()A、折线图B、散点图C、条形图D、饼图正确答案:A第9题,下列哪个R语言扩展包可以制作一系列的图像并将它们串联起来做成动画()A、ggplot2B、networkC、ggmapsD、animation正确答案:D第10题,医疗健康数据的基本情况不

3、包括以下哪项?A、诊疗数据B、个人健康管理数据C、公共安全数据D、健康档案数据正确答案:C第11题,以下哪项不是数据可视化工具的特性()A、实时性B、简单操作C、更丰富的展现D、仅需一种数据支持方式即可正确答案:D第12题,数据仓库是随着时间变化的,下列不正确的是()A、数据仓库随时间变化不断增加新内容B、捕捉到的新数据会覆盖原来的快照C、数据仓库随事件变化不断删去旧的数据内容D、数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合正确答案:C第13题,DAS代表的意思是()A、两个异步存储B、数据归档软件C、连接一个可选的存储D、直连存储正确答案:D第14题,大数据的特点

4、不包含A、数据体量大B、价值密度高C、处理速度快D、数据不统一正确答案:D第15题,下列哪个R语言扩展包可以创建带有点和边的网络图()A、ggplot2B、networkC、ggmapsD、animation正确答案:B第16题,大数据的技术支撑有()A、计算速度加快B、存储成本下降C、机器智能化D、数据量增加正确答案:A,B,C第17题,医疗领域如何利用大数据A、临床决策支持B、个性化医疗C、社保资金安全D、用户行为分析正确答案:A,B,C,D第18题,大数据时代预测人类移动行为的数据来源有A、志愿者定位数据B、装有导航设备的出租车轨迹数据C、手机终端定位于通讯记录D、社会网络签到数据正确答

5、案:A,B,C,D第19题,互连网上出现的海量信息可以划分为三种,分别为( )A、结构化信息B、非结构化信息C、半结构化信息D、特殊化信息正确答案:A,B,C第20题,大数据在社交网络中的应用A、用户偏好、情感、社交网络结构B、用户画像、精准推荐C、舆情监控、突发事件预警D、预测外部趋势正确答案:A,B,C,D第21题,数据工厂包括A、低能耗数据中心B、超大规模讲分布式架构C、新一代智能自动化运维D、超强云安全正确答案:A,B,C,D第22题,可使用#,#,#进行光滑。A、最大值B、箱中位数C、箱边界D、箱均值正确答案:B,C,D第23题,数据变换的常用方法有#,#,#,#A、中心化变换B、极

6、差规格化变换C、标准化变换D、对数变换正确答案:A,B,C,D第24题,大数据采集主要包括()四种。A、系统日志采集B、网络数据采集C、数据库采集D、其他数据采集正确答案:A,B,C,D第25题,#和#,它们把原数据变换或投影到较小的空间。A、小波变换B、中心化变换C、主成分分析D、对数变换正确答案:A,C第26题,开放云()A、价值呈现:大数据应用价值呈现和创新不足B、应用建设:周期长、门槛高、多冗余、体验差C、组织流程:应用跨部门,缺乏流程贯串和使能业务生产D、生态建设:无法有效构建和融入新的数字生态圈正确答案:A,B,C,D第27题,百度大脑包括()A、深度学习B、超大规模机器学习C、大

7、规模GPU并行化平台正确答案:A,B,C第28题,数据变换(Data Transformation)的方法有()A、光滑B、聚集C、数据泛化D、规范化正确答案:A,B,C,D第29题,医疗大数据的来源主要包括()A、制药企业/生命科学B、临床医疗/实验室数据C、费用报销/利用率D、健康管理/社交网络正确答案:A,B,C,D第30题,数据处理的两种方法是#,#A、批处理B、流处理C、单个处理D、交叉处理正确答案:A,B第31题,离群点检测的任务是识别特征显著不同于其他数据的观测值,这样的点称为异常点、离群点或孤立点。T、对F、错正确答案:T第32题,内存分析数据量比海量分析数据量大T、对F、错正

8、确答案:F第33题,Apriori算法扫描数据库的次数等于最大频繁项集的项数。T、对F、错正确答案:T第34题,内存分析数据量比BI分析数据量大T、对F、错正确答案:F第35题,关联分析又称为关联规则学习T、对F、错正确答案:T第36题,利用云存储中的多租户技术,满足了海量信息爆炸式增长趋势,一定程度上节约企业存储成本,提高效率。T、对F、错正确答案:F第37题,美国自然(Nature)杂志专刊The next google,第一次正式提出“大数据”概念。T、对F、错正确答案:T第38题,NAS代表的意思是网络附加存储T、对F、错正确答案:T第39题,数据可根据作用方式的不同分为交互数据和交易

9、数据T、对F、错正确答案:T第40题,云存储是指通过集群应用、网络技术或分布式文件系统等功能,将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统。T、对F、错正确答案:T第41题,描述性分析(Descriptive Analysis)基于当前事件来描述发生的事件T、对F、错正确答案:F第42题,大数据虽然拥有大量的价值信息,但是价值密度较低T、对F、错正确答案:T第43题,数据的集中存储增加了数据泄露风险。T、对F、错正确答案:T第44题,大数据需要对多种数据混合访问,催生出了新的、需要考虑安全性的问题。T、对F、错正确答案:T第45题

10、,时间序列分析是对随时间变化的数据对象的变化规律和演化趋势进行建模分析T、对F、错正确答案:T第46题,IDC给出的大数据定义是大数据(Big Data)是需要新的处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。T、对F、错正确答案:F第47题,MapReduce则为海量的数据提供了并行计算,从而大大提高了计算效率;T、对F、错正确答案:T第48题,大数据成为高级可持续攻击的载体T、对F、错正确答案:T第49题,未来考验零售企业的是如何挖掘消费者需求T、对F、错正确答案:T第50题,Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。T、对F、错正确答案:T

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号