南开21春学期满分答案-(1709、1803--2103)《大数据导论》在线作业215454

上传人:1389****087 文档编号:183744497 上传时间:2021-06-14 格式:DOCX 页数:10 大小:16.97KB
返回 下载 相关 举报
南开21春学期满分答案-(1709、1803--2103)《大数据导论》在线作业215454_第1页
第1页 / 共10页
南开21春学期满分答案-(1709、1803--2103)《大数据导论》在线作业215454_第2页
第2页 / 共10页
亲,该文档总共10页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《南开21春学期满分答案-(1709、1803--2103)《大数据导论》在线作业215454》由会员分享,可在线阅读,更多相关《南开21春学期满分答案-(1709、1803--2103)《大数据导论》在线作业215454(10页珍藏版)》请在金锄头文库上搜索。

1、21春学期(1709、1803、1809、1903、1909、2003、2009、2103)大数据导论在线作业判断题11一、单选题111共15题,30分1、以下不是数据仓库基本特征的是()A数据仓库是面向主题的B数据仓库是面向事务的C数据仓库的数据是相对稳定的D数据仓库的数据是反映历史变化的我的得分:2分我的答案:B解析:暂无内容2、第一个提出大数据概念的公司是( )。A麦肯锡公司B谷歌公司C微软公司D脸谱公司我的得分:2分我的答案:A解析:暂无内容3、基础设施即服务的英文简称是AIaaSBPaaSCSaaS我的得分:2分我的答案:A解析:暂无内容4、()是Microsoft Office的核

2、心组件ASQLBWORDCPPTDEXCEL我的得分:2分我的答案:D解析:暂无内容5、MapReduce中的Map和Reduce函数使用()进行输入输出Akey/value对B随机数值C其他计算结果我的得分:2分我的答案:A解析:暂无内容6、下列哪个R语言扩展包可以制作一系列的图像并将它们串联起来做成动画()Aggplot2BnetworkCggmapsDanimation我的得分:2分我的答案:D解析:暂无内容7、GFS中的文件切分成()的块进行存储A32MBB64MBC128MBD1G我的得分:2分我的答案:B解析:暂无内容8、大数据的最显著特征是() 。A数据规模大B数据类型多样C数据

3、处理速度快D数据价值密度高我的得分:2分我的答案:A解析:暂无内容9、下列哪个R语言扩展包可以创建带有点和边的网络图()Aggplot2BnetworkCggmapsDanimation我的得分:2分我的答案:B解析:暂无内容10、大数据的特点不包含A数据体量大B价值密度高C处理速度快D数据不统一我的得分:2分我的答案:D解析:暂无内容11、下面哪一项不是中国发展大数据产业的基础()。A信息化积累了丰富的数据资源B大数据技术创新取得明显突破C大数据应用推动势头良好D大数据产业支撑薄弱我的得分:2分我的答案:D解析:暂无内容12、数据仓库是随着时间变化的,下列不正确的是()A数据仓库随时间变化不

4、断增加新内容B捕捉到的新数据会覆盖原来的快照C数据仓库随事件变化不断删去旧的数据内容D数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合我的得分:2分我的答案:C解析:暂无内容13、数据产生方式变革中数据产生方式是被动的主要是来自哪个阶段( )。A运营式系统阶段B用户原创内容阶段C感知式系统阶段我的得分:2分我的答案:A解析:暂无内容14、购物篮问题是的典型案例A数据变换B关联规则挖掘C数据分类我的得分:2分我的答案:B解析:暂无内容15、数据清洗的方法不包括A缺失值处理B噪声数据清除C一致性检查D重复数据记录处理我的得分:2分我的答案:D解析:暂无内容二、多选题共15题

5、,30分1、统计图表的可视化方法主要包括()A散点图B折线图C条形图D饼图我的得分:2分我的答案:ABCD解析:暂无内容2、和,它们把原数据变换或投影到较小的空间。A小波变换B中心化变换C主成分分析D对数变换我的得分:2分我的答案:AC解析:暂无内容3、常见的分类方法有A决策树B贝叶斯网络C遗传算法DFP算法我的得分:2分我的答案:ABC解析:暂无内容4、传感器工作模式类别包括()A基于位置B基于活动C基于设备我的得分:2分我的答案:ABC解析:暂无内容5、大数据智能感知层:主要包括()及软硬件资源接入系统A数据传感体系B网络通信体系C传感适配体系D智能识别体系我的得分:2分我的答案:ABCD

6、解析:暂无内容6、数据归约(Data Reduction)主要有有()A维度规约B样本规约C数据聚集D离散化概念分层我的得分:2分我的答案:ABCD解析:暂无内容7、可视化工具包括()AExcelBGoogle ChartCGephiDppt我的得分:2分我的答案:ABC解析:暂无内容8、可使用,进行光滑。A最大值B箱中位数C箱边界D箱均值我的得分:2分我的答案:BCD解析:暂无内容9、借助于大数据提供的和,政府可为农业生产进行合理引导,依据需求进行生产,避免产能过剩造成不必要的资源和社会财富浪费。A消费能力B趋势报告C购物结果我的得分:2分我的答案:AB解析:暂无内容10、离群点检测的应用包

7、括()等。A欺诈检测B入侵检测C故障检测D疾病的不寻常模式我的得分:2分我的答案:ABCD解析:暂无内容11、下列属于传统统计学展示方法的是()A柱状图B饼状图C曲线图D网络图我的得分:2分我的答案:ABC解析:暂无内容12、大数据存储的特点与挑战有()A容量问题B延迟问题C安全问题D成本问题我的得分:2分我的答案:ABCD解析:暂无内容13、大数据时代预测人类移动行为的数据来源有A志愿者定位数据B装有导航设备的出租车轨迹数据C手机终端定位于通讯记录D社会网络签到数据我的得分:2分我的答案:ABCD解析:暂无内容14、医疗大数据特点:除了包含了大数据4个“V” 的特点之外还有()A多态性B时效

8、性C不完整性D冗余性我的得分:2分我的答案:ABCD解析:暂无内容15、基于大数据的临床决策支持系统的架构包括A支撑层B大数据分析层C网络层D应用层我的得分:2分我的答案:ABD解析:暂无内容三、判断题共20题,40分1、NAS是一种采用直接与网络介质相连的特殊设备实现数据存储的模式。A对B错我的得分:2分我的答案:A解析:暂无内容2、在集成期间,当一个数据库的属性与另一个数据库的属性匹配时,必须特别注意数据的结构。这旨在确保源系统中的函数依赖和参照约束与目标系统中的匹配。A对B错我的得分:2分我的答案:A解析:暂无内容3、Gartner研究机构给出的大数据定义是大数据一般会涉及两种或两种以上

9、的数据形式,它需要收集超过100TB的数据,并且是高速实时数据流;或者是从小数据开始,但数据每年增长速率至少为60%。A对B错我的得分:2分我的答案:B解析:暂无内容4、Python是一种面向对象的解释型计算机程序设计语言A对B错我的得分:2分我的答案:A解析:暂无内容5、数据集成(Data Integration)是将多个数据源中的数据合并存放到一个一致的数据存储中,数据源可以包含多个数据库、数据立方体或一般文件。A对B错我的得分:2分我的答案:A解析:暂无内容6、内存级分析适用于总数据量在集群内存的最大级别以内的情况,使用内部数据库技术,适合实时业务分析需求。A对B错我的得分:2分我的答案

10、:A解析:暂无内容7、按照数据量的大小,可将数据分析分为内存级数据分析、Bl级数据分析和海量级数据分析。A对B错我的得分:2分我的答案:A解析:暂无内容8、美国奥巴马政府宣布投资2亿美元启动“大数据研发计划”A对B错我的得分:2分我的答案:A解析:暂无内容9、在现有大数据的存储中,结构化数据仅有20%,其余80%则在存在于物联网、电子商务、社交网络等 领域的半结构化数据和非结构化数据A对B错我的得分:2分我的答案:A解析:暂无内容10、聚类分析(Cluster analysis)简称聚类(Clustering),是把数据对象划分成子集(类)的过程,每个子集称为一个簇(Cluster)A对B错我

11、的得分:2分我的答案:A解析:暂无内容11、大数据处理的关键技术主要包括:数据采集和预处理、数据存储、数据计算架构、数据分析和挖掘、数据可视化展示等。A对B错我的得分:2分我的答案:A解析:暂无内容12、居民通过健康云平台中的数据,了解健康情况,防患于未然;医疗机构通过对远程监控系统中的数据分析,缩短住院时间,提高家庭护理比例和门诊医生预约量。A对B错我的得分:2分我的答案:A解析:暂无内容13、交通数据的来源包括车辆GPS数据,人类移动的GPS位置信息或者单位站点记录,和监视设备的视频图像技术记录。A对B错我的得分:2分我的答案:A解析:暂无内容14、大数据技术也能帮助政府进行支出管理,透明

12、合理的财政支出将有利于提高公信力和监督财政支出。A对B错我的得分:2分我的答案:A解析:暂无内容15、非结构化数据是指非纯文本类数据,没有标准格式,无法直接解析出相应的值A对B错我的得分:2分我的答案:A解析:暂无内容16、关联分析又称为关联规则学习A对B错我的得分:2分我的答案:A解析:暂无内容17、Pentaho是最流行的开源商业智能软件之一A对B错我的得分:2分我的答案:A解析:暂无内容18、我们既要通过政府主导,又要发挥社会的力量,来共同推进医疗大数据的应用A对B错我的得分:2分我的答案:A解析:暂无内容19、每个变量的最大值和最小值之差称为极差A对B错我的得分:2分我的答案:A解析:暂无内容20、数据采集,又称数据获取,是大数据生命周期的第一个环节,通过RFID射频识别技术,传感器,交互型社交网络,移动互联网等方式获得的各种类型的结构化、半结构化及非结构化的海量数据。A对B错我的得分:2分我的答案:A解析:暂无内容

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号