南开大学21春学期(1709、1803、1809、1903、1909、2003、2009、2103)《大数据导论》在线作业2

上传人:Q****0 文档编号:183372288 上传时间:2021-06-03 格式:DOC 页数:8 大小:16.88KB
返回 下载 相关 举报
南开大学21春学期(1709、1803、1809、1903、1909、2003、2009、2103)《大数据导论》在线作业2_第1页
第1页 / 共8页
南开大学21春学期(1709、1803、1809、1903、1909、2003、2009、2103)《大数据导论》在线作业2_第2页
第2页 / 共8页
亲,该文档总共8页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《南开大学21春学期(1709、1803、1809、1903、1909、2003、2009、2103)《大数据导论》在线作业2》由会员分享,可在线阅读,更多相关《南开大学21春学期(1709、1803、1809、1903、1909、2003、2009、2103)《大数据导论》在线作业2(8页珍藏版)》请在金锄头文库上搜索。

1、南开21春学期大数据导论在线作业21.大数据的特点不包含A.数据体量大B.价值密度高C.处理速度快D.数据不统一【参考答案】: D2.数据产生方式变革中数据产生方式是自动的主要是来自哪个阶段( )。A.运营式系统阶段B.用户原创内容阶段C.感知式系统阶段【参考答案】: C3.下列哪个R语言扩展包可以创建带有点和边的网络图()A.ggplot2B.networkC.ggmapsD.animation【参考答案】: B4.数据产生方式变革中数据产生方式是被动的主要是来自哪个阶段( )。A.运营式系统阶段B.用户原创内容阶段C.感知式系统阶段【参考答案】: A5.IaaS是()的简称A.软件即服务B

2、.平台即服务C.基础设施即服务D.硬件即服务【参考答案】: C6.以下不是数据仓库基本特征的是()A.数据仓库是面向主题的B.数据仓库是面向事务的C.数据仓库的数据是相对稳定的D.数据仓库的数据是反映历史变化的【参考答案】: B7.基础设施即服务的英文简称是A.IaaSB.PaaSC.SaaS【参考答案】: A8.哪个选项不属于大数据4V特点?A.VolumeB.ValidC.VarietyD.Value【参考答案】: B9.SAN是一种()A.存储设备B.专为数据存储而设计构建的网络C.光纤交换机D.HBA【参考答案】: B10.PaaS是()的简称A.软件即服务B.平台即服务C.基础设施即

3、服务D.硬件即服务【参考答案】: B11.下列不属于商业大数据类型的是A.传统企业数据B.机器和传感器数据C.社交数据D.电子商务数据【参考答案】: B12.用于描述数据分散情况的是()A.分布图B.箱式图C.饼图D.折线图【参考答案】: B13.DAS代表的意思是()A.两个异步存储B.数据归档软件C.连接一个可选的存储D.直连存储【参考答案】: D14.数据仓库是随着时间变化的,下列不正确的是()A.数据仓库随时间变化不断增加新内容B.捕捉到的新数据会覆盖原来的快照C.数据仓库随事件变化不断删去旧的数据内容D.数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合【参考答

4、案】: C15.数据清洗的方法不包括A.缺失值处理B.噪声数据清除C.一致性检查D.重复数据记录处理【参考答案】: D16.常见的非结构化数据有()A.web网页B.即时消息C.富文本文档D.实时多媒体数据【参考答案】: ABCD17.网络数据采集常用的是通过#或#等方式从网站上获取数据信息。A.网络爬虫B.网站公开APIC.手动获取【参考答案】: AB18.对于数值属性,我们使用()来评估一个属性的值如何随另一个属性变化。A.欧式距离B.相关系数C.协方差【参考答案】: BC19.传感器工作模式类别包括()A.基于位置B.基于活动C.基于设备【参考答案】: ABC20.层次方法可以分为()A

5、.K均值算法B.K中心点算法C.凝聚法D.分裂法【参考答案】: CD21.下列正确的是()A.D3是数据驱动文件的缩写,是最流行的可视化库之一,它被很多其他的表格插件所使用B.D3也可以通过一些自定义模块来根据需求增添需要的(非DOM)特性,并在WebWorker上运行C.D3采用的是Selectors API的第一级标准D.基础R已经包含支撑包括协同图(Coplot)、拼接图(Mosaic Plot)和双标图等多类图形的功能。【参考答案】: ABCD22.大数据在教育中的应用A.网上公开课B.慕课C.智慧校园D.翻转课堂【参考答案】: ABCD23.基于大数据的临床决策支持系统的架构包括A.

6、支撑层B.大数据分析层C.网络层D.应用层【参考答案】: ABD24.按照数据量的大小,可将数据分析分为()A.内存级数据分析B.Bl级数据分析C.海量级数据分析D.巨量级数据分析【参考答案】: ABC25.医疗大数据特点:除了包含了大数据4个“V” 的特点之外还有()A.多态性B.时效性C.不完整性D.冗余性【参考答案】: ABCD26.借助于大数据提供的#和#,政府可为农业生产进行合理引导,依据需求进行生产,避免产能过剩造成不必要的资源和社会财富浪费。A.消费能力B.趋势报告C.购物结果【参考答案】: AB27.交通数据处理包括以下几个步骤()A.数据清洗B.数据映射C.数据组织D.数据聚

7、类【参考答案】: ABCD28.统计图表的可视化方法主要包括()A.散点图B.折线图C.条形图D.饼图【参考答案】: ABCD29.#和#,它们把原数据变换或投影到较小的空间。A.小波变换B.中心化变换C.主成分分析D.对数变换【参考答案】: AC30.百度大脑包括()A.深度学习B.超大规模机器学习C.大规模GPU并行化平台【参考答案】: ABC31.利用云存储中的多租户技术,满足了海量信息爆炸式增长趋势,一定程度上节约企业存储成本,提高效率。T.对F.错【参考答案】: F32.结构化数据是用excel结构表现的数据T.对F.错【参考答案】: F33.关联分析又称为关联规则学习T.对F.错【

8、参考答案】: T34.大数据处理的关键技术主要包括:数据采集和预处理、数据存储、数据计算架构、数据分析和挖掘、数据可视化展示等。T.对F.错【参考答案】: T35.原始交通数据记录是离散样本点而且可能不能映射到城市的道路网络中。T.对F.错【参考答案】: T36.饼图以二维或者三维的形式表示某一数据相对于数据总量的大小,用于数据之间比重的比较。T.对F.错【参考答案】: T37.Pentaho是最流行的开源商业智能软件之一T.对F.错【参考答案】: T38.数据采集,又称数据获取,是大数据生命周期的第一个环节,通过RFID射频识别技术、传感器、交互型社交网络以及移动互联网等方式获得的各种类型的

9、结构化、半结构化及非结构化的海量数据。T.对F.错【参考答案】: T39.数据可根据作用方式的不同分为交互数据和交易数据T.对F.错【参考答案】: T40.由于数据变成资源,成为有价值的东西,数据私有化和独占问题就是客观存在的,成为关注的焦点。数据产权界定问题日益突出,在数据权属确定的情况下,数据商品化将成为必然选择T.对F.错【参考答案】: T41.ID3算法的核心思想就是以信息增益度量属性选择T.对F.错【参考答案】: T42.预测性分析(Predictive Analysis)用于预测未来事件发生的概率和演化趋势T.对F.错【参考答案】: T43.交通数据的来源包括车辆GPS数据,人类移

10、动的GPS位置信息或者单位站点记录,和监视设备的视频图像技术记录。T.对F.错【参考答案】: T44.每个变量的最大值和最小值之差称为极差T.对F.错【参考答案】: T45.频繁项集的子集是频繁项集,非频繁项集的超集是非频繁项集。T.对F.错【参考答案】: T46.云计算出现后,数据存储服务衍生出了新的商业模式,数据中心的出现降低了公司的计算和存储成本。T.对F.错【参考答案】: T47.所有关系型数据中的数据全部为结构化数据。半结构化数据就是介于完全结构化数据和完全无结构化的数据之间的数据。T.对F.错【参考答案】: T48.云存储中用户需要按需付费并使用存储服务T.对F.错【参考答案】: T49.数据会吸引更多的潜在攻击者,成为更具吸引力的目标。T.对F.错在线考试、网考小企鹅:2168254948【参考答案】: T50.大数据需要对多种数据混合访问,催生出了新的、需要考虑安全性的问题。T.对F.错【参考答案】: T

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号