南开19春学期(1709、1803、1809、1903)《大数据导论》在线作业-0002参考答案

上传人:学*** 文档编号:89583314 上传时间:2019-05-29 格式:DOC 页数:9 大小:39KB
返回 下载 相关 举报
南开19春学期(1709、1803、1809、1903)《大数据导论》在线作业-0002参考答案_第1页
第1页 / 共9页
亲,该文档总共9页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《南开19春学期(1709、1803、1809、1903)《大数据导论》在线作业-0002参考答案》由会员分享,可在线阅读,更多相关《南开19春学期(1709、1803、1809、1903)《大数据导论》在线作业-0002参考答案(9页珍藏版)》请在金锄头文库上搜索。

1、19春学期(1709、1803、1809、1903)大数据导论在线作业-0002试卷总分:100 得分:0一、 单选题 (共 15 道试题,共 30 分)1.IaaS是()的简称A.软件即服务B.平台即服务C.基础设施即服务D.硬件即服务正确答案:C2.下面哪一项不是中国发展大数据产业的基础()。A.信息化积累了丰富的数据资源B.大数据技术创新取得明显突破C.大数据应用推动势头良好D.大数据产业支撑薄弱正确答案:D3.用于描述数据分散情况的是()A.分布图B.箱式图C.饼图D.折线图正确答案:B4.PaaS是()的简称A.软件即服务B.平台即服务C.基础设施即服务D.硬件即服务正确答案:B5.

2、GFS中的文件切分成()的块进行存储A.32MBB.64MBC.128MBD.1G正确答案:B6.大数据的最显著特征是() 。A.数据规模大B.数据类型多样C.数据处理速度快D.数据价值密度高正确答案:A7.SAN是一种()A.存储设备B.专为数据存储而设计构建的网络C.光纤交换机D.HBA正确答案:B8.用于描述相等时间间隔下连续数据随时间变化趋势的是()A.折线图B.散点图C.条形图D.饼图正确答案:A9.下列哪个R语言扩展包可以制作一系列的图像并将它们串联起来做成动画()A.ggplot2B.networkC.ggmapsD.animation正确答案:D10.医疗健康数据的基本情况不包

3、括以下哪项?A.诊疗数据B.个人健康管理数据C.公共安全数据D.健康档案数据正确答案:C11.以下哪项不是数据可视化工具的特性()A.实时性B.简单操作C.更丰富的展现D.仅需一种数据支持方式即可正确答案:D12.数据仓库是随着时间变化的,下列不正确的是()A.数据仓库随时间变化不断增加新内容B.捕捉到的新数据会覆盖原来的快照C.数据仓库随事件变化不断删去旧的数据内容D.数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合正确答案:C13.DAS代表的意思是()A.两个异步存储B.数据归档软件C.连接一个可选的存储D.直连存储正确答案:D14.大数据的特点不包含A.数据体量

4、大B.价值密度高C.处理速度快D.数据不统一正确答案:D15.下列哪个R语言扩展包可以创建带有点和边的网络图()A.ggplot2B.networkC.ggmapsD.animation正确答案:B二、 多选题 (共 15 道试题,共 30 分)1.大数据的技术支撑有()A.计算速度加快B.存储成本下降C.机器智能化D.数据量增加正确答案:ABC2.医疗领域如何利用大数据A.临床决策支持B.个性化医疗C.社保资金安全D.用户行为分析正确答案:ABCD3.大数据时代预测人类移动行为的数据来源有A.志愿者定位数据B.装有导航设备的出租车轨迹数据C.手机终端定位于通讯记录D.社会网络签到数据正确答案

5、:ABCD4.互连网上出现的海量信息可以划分为三种,分别为( )A.结构化信息B.非结构化信息C.半结构化信息D.特殊化信息正确答案:ABC5.大数据在社交网络中的应用A.用户偏好、情感、社交网络结构B.用户画像、精准推荐C.舆情监控、突发事件预警D.预测外部趋势正确答案:ABCD6.数据工厂包括A.低能耗数据中心B.超大规模讲分布式架构C.新一代智能自动化运维D.超强云安全正确答案:ABCD7.可使用#,#,#进行光滑。A.最大值B.箱中位数C.箱边界D.箱均值正确答案:BCD8.数据变换的常用方法有#,#,#,#A.中心化变换B.极差规格化变换C.标准化变换D.对数变换正确答案:ABCD9

6、.大数据采集主要包括()四种。A.系统日志采集B.网络数据采集C.数据库采集D.其他数据采集正确答案:ABCD10.#和#,它们把原数据变换或投影到较小的空间。A.小波变换B.中心化变换C.主成分分析D.对数变换正确答案:AC11.开放云()A.价值呈现:大数据应用价值呈现和创新不足B.应用建设:周期长、门槛高、多冗余、体验差C.组织流程:应用跨部门,缺乏流程贯串和使能业务生产D.生态建设:无法有效构建和融入新的数字生态圈正确答案:ABCD12.百度大脑包括()A.深度学习B.超大规模机器学习C.大规模GPU并行化平台正确答案:ABC13.数据变换(Data Transformation)的方

7、法有()A.光滑B.聚集C.数据泛化D.规范化正确答案:ABCD14.医疗大数据的来源主要包括()A.制药企业/生命科学B.临床医疗/实验室数据C.费用报销/利用率D.健康管理/社交网络正确答案:ABCD15.数据处理的两种方法是#,#A.批处理B.流处理C.单个处理D.交叉处理正确答案:AB三、 判断题 (共 20 道试题,共 40 分)1.离群点检测的任务是识别特征显著不同于其他数据的观测值,这样的点称为异常点、离群点或孤立点。A.对B.错正确答案:A2.内存分析数据量比海量分析数据量大A.对B.错正确答案:B3.Apriori算法扫描数据库的次数等于最大频繁项集的项数。A.对B.错正确答

8、案:A4.内存分析数据量比BI分析数据量大A.对B.错正确答案:B5.关联分析又称为关联规则学习A.对B.错正确答案:A6.利用云存储中的多租户技术,满足了海量信息爆炸式增长趋势,一定程度上节约企业存储成本,提高效率。A.对B.错正确答案:B7.美国自然(Nature)杂志专刊The next google,第一次正式提出“大数据”概念。A.对B.错正确答案:A8.NAS代表的意思是网络附加存储A.对B.错正确答案:A9.数据可根据作用方式的不同分为交互数据和交易数据A.对B.错正确答案:A10.云存储是指通过集群应用、网络技术或分布式文件系统等功能,将网络中大量各种不同类型的存储设备通过应用

9、软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统。A.对B.错正确答案:A11.描述性分析(Descriptive Analysis)基于当前事件来描述发生的事件A.对B.错正确答案:B12.大数据虽然拥有大量的价值信息,但是价值密度较低A.对B.错正确答案:A13.数据的集中存储增加了数据泄露风险。A.对B.错正确答案:A14.大数据需要对多种数据混合访问,催生出了新的、需要考虑安全性的问题。A.对B.错正确答案:A15.时间序列分析是对随时间变化的数据对象的变化规律和演化趋势进行建模分析A.对B.错正确答案:A16.IDC给出的大数据定义是大数据(Big Data)是需要新的处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。A.对B.错正确答案:B17.MapReduce则为海量的数据提供了并行计算,从而大大提高了计算效率;A.对B.错正确答案:A18.大数据成为高级可持续攻击的载体A.对B.错正确答案:A19.未来考验零售企业的是如何挖掘消费者需求A.对B.错正确答案:A20.Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。A.对B.错正确答案:A

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号