南开大学21秋《数据科学导论》平时作业一参考答案66

上传人:pu****.1 文档编号:457179751 上传时间:2022-11-08 格式:DOCX 页数:12 大小:14.07KB
返回 下载 相关 举报
南开大学21秋《数据科学导论》平时作业一参考答案66_第1页
第1页 / 共12页
南开大学21秋《数据科学导论》平时作业一参考答案66_第2页
第2页 / 共12页
南开大学21秋《数据科学导论》平时作业一参考答案66_第3页
第3页 / 共12页
南开大学21秋《数据科学导论》平时作业一参考答案66_第4页
第4页 / 共12页
南开大学21秋《数据科学导论》平时作业一参考答案66_第5页
第5页 / 共12页
点击查看更多>>
资源描述

《南开大学21秋《数据科学导论》平时作业一参考答案66》由会员分享,可在线阅读,更多相关《南开大学21秋《数据科学导论》平时作业一参考答案66(12页珍藏版)》请在金锄头文库上搜索。

1、南开大学21秋数据科学导论平时作业一参考答案1. 给定关联规则AB,意味着若A发生,B也会发生。( )A.正确B.错误参考答案:B2. 使用SVD方法进行图像压缩不可以保留图像的重要特征。( )A.正确B.错误参考答案:B3. 探索性数据分析的特点是研究从原始数据入手,完全以实际数据为依据。( )A.正确B.错误参考答案:A4. 关于R语言扩展包下列正确的是( )A.network可创建带有点和边的网络图B.animation可制作一系列的图像并将它们串联起来做成动画C.ggmaps通过树图来可视化层次型数据D.protfolio基于谷歌地图、OpenStreetMap及其他地图的空间数据可视

2、化工具参考答案:AB5. random库采用梅森旋转算法生成伪随机序列。( )A.正确B.错误参考答案:A6. HDFS为海量的数据提供了存储。( )T.对F.错参考答案:T7. 下列不属于商业大数据类型的是( )A.传统企业数据B.机器和传感器数据C.社交数据D.电子商务数据参考答案:B8. 以下哪个关键字不是异常处理语句的关键字?( )A.elifB.exceptC.tryD.finally参考答案:A9. 美国自然(Nature)杂志专刊The next google,第一次正式提出“大数据”概念。( )T.对F.错参考答案:T10. K均值(K-Means)算法是密度聚类。( )A.正

3、确B.错误参考答案:B11. K-means聚类是发现给定数据集的K个簇的算法。( )A.正确B.错误参考答案:A12. 程序语句len(str(3.1415)的输出结果为( )。A.4B.5C.6D.7参考答案:C13. KNIME(Konstanz Information Miner)是一个对用户友好的、智能、开源的平台。该平台包括了( )、( )、( )、( )。A.数据集成B.数据处理C.数据分析D.数据挖掘参考答案:ABCD14. 通过构造新的指标线损率,当超出线损率的正常范围,则可以判断这条线路的用户可能存在窃漏电等异常行为属于数据变换中的( )。A.简单函数变换B.规范化C.属性

4、构造D.连续属性离散化参考答案:C15. 给定一组点,使用点之间的距离概念,将点分组为若干簇,不同簇的成员可以相同。( )A.正确B.错误参考答案:B16. 一元回归参数估计的参数求解方法有( )。A.最大似然法B.距估计法C.最小二乘法D.欧式距离法参考答案:ABC17. 决策树分类时将该结点的实例强行分到条件概率大的那一类去。( )A.正确B.错误参考答案:A18. 大数据带来的挑战有哪些( )。A.会导致数据盲点B.危及个人隐私C.造成群体歧视D.产生庞大能耗参考答案:ABCD19. 根据映射关系的不同可以分为线性回归和( )。A.对数回归B.非线性回归C.逻辑回归D.多元回归参考答案:

5、B20. 实体识别的常见形式:( )A.同名异义B.异名同义C.单位不统一D.属性不同参考答案:D21. 当特征为离散型时,可以使用信息增益作为评价统计量。( )A.正确B.错误参考答案:A22. 大数据的最显著特征是( )。A.数据规模大B.数据类型多样C.数据处理速度快D.数据价值密度高参考答案:A23. 怪物猎人OL我在游戏中发现身边有许多不同的小箭头指向不同的地方,这个代表什么?怪物猎人OL我在游戏中发现身边有许多不同的小箭头指向不同的地方,这个代表什么?这是怪物猎人OL的任务指示器,箭头所指示的方向为你所接取的任务的完成地点,如果你同时接取了多个任务,那么会有多个箭头指向不同的区域,

6、所以新手猎人跟着指示器走即可到达目标区域。24. 在list对象中添加元素可以使用add( )函数,将要添加的值加入列表尾部。( )A.正确B.错误参考答案:B25. 考虑下面的频繁3-项集的集合:1,2,3,1,2,4,1,2,5,1,3,4,1,3,5,2,3,4,2,3,5,3,4,5;假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含( )。A.1,2,3,4B.1,2,3,5C.1,2,4,5D.1,3,4,5参考答案:C26. 获取数据为数据分析提供了素材和依据,这里的数据只包括直接获取的数据。( )A.正确B.错误参考答案:B27. 利用最小二乘法对多元线性回

7、归进行参数估计时,其目标为( )。A.最小化方差B.最小化残差平方和C.最大化信息熵D.最小化标准差参考答案:C28. 去除噪声使得数据光滑的技术主要有:( )A.分箱B.回归C.离群点分析参考答案:ABC29. BFR聚类用于在( )欧氏空间中对数据进行聚类。A.高维B.中维C.低维D.中高维参考答案:A30. 局部变量若与全局变量重名,则不能在函数内部创建和使用。( )A.正确B.错误参考答案:B31. Extranet有哪些功能?Extranet有哪些功能?参考答案:1.信息资源共享:与外部企业共享信息资源2.业务协作处理:建立业务协同处理链接,优化业务流程3.共同开发新业务:形成虚拟联

8、合企业32. 多层感知机的学习过程包含( )。A.信号的正向传播B.信号的反向传播C.误差的正向传播D.误差的反向传播参考答案:AD33. 属性或维命名的不一致也可能导致结果数据集中的数据冗余。( )T.对F.错参考答案:T34. 以下哪一项不是特征选择常见的方法?( )A.过滤式B.封装式C.嵌入式D.开放式参考答案:D35. Python中定义函数的关键字是( )。A.defB.defineC.functionD.defunc参考答案:A36. K-means聚类中K值选取的方法是( )。A.密度分类法B.手肘法C.大腿法D.随机选取参考答案:AB37. 常见的非结构化数据有( )A.we

9、b网页B.即时消息C.富文本文档D.实时多媒体数据参考答案:ABCD38. 聚类的主要方法有( )。A.划分聚类B.层次聚类C.密度聚类D.距离聚类参考答案:ABC39. 单层感知机模型属于( )模型。A.二分类的线性分类模型B.二分类的非线性分类模型C.多分类的线性分类模型D.多分类的非线性分类模型参考答案:A40. MapReduce中的Map和Reduce函数使用( )进行输入输出A.key/value对B.随机数值C.其他计算结果参考答案:A41. IPsec处于OSI七层模型的哪一层( )A、物理层B、链路层C、网络层D、应用层参考答案:C42. 宁家骏委员指出,我国发展医疗服务业,

10、同时发展智慧养老。( )T.对F.错参考答案:T43. 时空数据是指带有地理位置与时间标签的数据。( )T.对F.错参考答案:T44. Pearson相关系数是判断特征之间、以及特征和目标变量之间线性相关关系的统计量。( )A.正确B.错误参考答案:A45. 在k近邻法中,选择较小的k值时,学习的“近似误差”会( ),“估计误差”会( )。A.减小,减小B.减小,增大C.增大,减小D.增大,增大参考答案:B46. GFS中的文件切分成( )的块进行存储A.32MBB.64MBC.128MBD.1G参考答案:B47. 置信度(confidence)是衡量兴趣度度量( )的指标。A.简洁性B.确定

11、性C.实用性D.新颖性参考答案:B48. k值增大意味着整体模型变得复杂。( )k值增大意味着整体模型变得复杂。( )A.正确B.错误参考答案:B49. 以下不是数据仓库基本特征的是( )A.数据仓库是面向主题的B.数据仓库是面向事务的C.数据仓库的数据是相对稳定的D.数据仓库的数据是反映历史变化的参考答案:B50. 下面关于网站内容管理系统的描述,不正确的是( )。A. 网站内容管理系统的缩写为CMSB. 将网站模板与网站内容相分离C. 只能管理结构化内容,不能管理非结构化内容D. 由文档模板、脚本语言或标记语言和数据库的集成构成参考答案:C51. 下列不是Python对文件进行读操作的方法

12、是( )。A.readtextB.readlinesC.readD.readline参考答案:A52. 如何理解移动商务?如何理解移动商务?参考答案:移动商务是利用手机、PDA等无线终端设备并与互联网有机结合进行的电子商务活动。互联网技术、移动通信技术、短距离技术及其它技术的完善组合创造了移动商务。53. 实体识别属于以下哪个过程?( )A.数据清洗B.数据集成C.数据规约D.数据变换参考答案:B54. 天涯明月刀是否能充值?天涯明月刀是否能充值?能充值,比例为1QB:100点券。55. NoSQL(名词解释)参考答案:NoSQL是泛指非关系型、分布式和不提供ACID的数据库,它不是单纯地反对

13、关系型数据库,而是强调键值存储和文档数据库的优点。56. 医疗健康数据的基本情况不包括以下哪项?( )A.诊疗数据B.个人健康管理数据C.公共安全数据D.健康档案数据参考答案:C57. 2月28日的王者同人绘栏目中,妲己宝宝为大家带来了哪名英雄的同人作品?2月28日的王者同人绘栏目中,妲己宝宝为大家带来了哪名英雄的同人作品?答案:大乔58. 信息熵越大,数据信息的不确定性越小。( )A.正确B.错误参考答案:B59. Python程序可以在任何安装了Python解释器的操作系统环境中执行。( )A.正确B.错误参考答案:A60. 以下哪一项不是特征工程的子问题?( )A.特征创建B.特征提取C.特征选择D.特征识别参考答案:D

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号