南开大学21秋《数据科学导论》在线作业二答案参考73

上传人:大米 文档编号:469754804 上传时间:2023-12-27 格式:DOCX 页数:13 大小:14.53KB
返回 下载 相关 举报
南开大学21秋《数据科学导论》在线作业二答案参考73_第1页
第1页 / 共13页
南开大学21秋《数据科学导论》在线作业二答案参考73_第2页
第2页 / 共13页
南开大学21秋《数据科学导论》在线作业二答案参考73_第3页
第3页 / 共13页
南开大学21秋《数据科学导论》在线作业二答案参考73_第4页
第4页 / 共13页
南开大学21秋《数据科学导论》在线作业二答案参考73_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《南开大学21秋《数据科学导论》在线作业二答案参考73》由会员分享,可在线阅读,更多相关《南开大学21秋《数据科学导论》在线作业二答案参考73(13页珍藏版)》请在金锄头文库上搜索。

1、南开大学21秋数据科学导论在线作业二答案参考1. 如何测试自己家中的宽带速率?宽带速率如何快速检测?如何测试自己家中的宽带速率?宽带速率如何快速检测?答案:1.停止其它设备的上网行为,只留一台电脑通过网线与光纤猫或路由器连接;2.打开电脑的浏览器,输入“”,进入网站(pc端,手机版需要下载)3.等待网页加载完成后点击“begin”,开始测试。4.测试结果很会显示在网页的正中央,出用户的延迟,下载速率和上传速率都会详细显示。2. 下面标识符中不是Python语言的关键字的是( )。A.floatB.exceptC.continueD.global参考答案:A3. 距离度量中的距离可以是( )。A

2、.欧式距离B.曼哈顿距离C.Lp距离D.Minkowski距离参考答案:ABCD4. 分拆方法是自底向上的方法。( )A.正确B.错误参考答案:B5. 在有统计学意义的前提下,标准化偏回归系数的绝对值越大,说明相应的自变量对y的作用( )。A.越小B.越大C.无关D.不确定参考答案:B6. 数据隐私和安全是大数据发展面临的挑战。( )T.对F.错参考答案:T7. HDFS为海量的数据提供了存储。( )T.对F.错参考答案:T8. 某商品的产量(X,件)与单位成本(Y,元/件)之间的回归方程为Y=100-1.2X,这说明( )。A.产量每增加一台,单位成本增加100元B.产量每增加一台,单位成本

3、减少1.2元C.产量每增加一台,单位成本平均减少1.2元D.产量每增加一台,单位平均增加100元参考答案:C9. 按照数据量的大小,可将数据分析分为( )A.内存级数据分析B.Bl级数据分析C.海量级数据分析D.巨量级数据分析参考答案:ABC10. 数据采集,又称数据获取,是大数据生命周期的第一个环节,通过RFID射频识别技术、传感器、交互型社交网络以及移动互联网等方式获得的各种类型的结构化、半结构化及非结构化的海量数据。( )T.对F.错参考答案:T11. BFR聚类用于在( )欧氏空间中对数据进行聚类。A.高维B.中维C.低维D.中高维参考答案:A12. 探索性数据分析的特点是研究从原始数

4、据入手,完全以实际数据为依据。( )A.正确B.错误参考答案:A13. 非结构化数据是指非纯文本类数据,没有标准格式,无法直接解析出相应的值。( )T.对F.错参考答案:T14. 下列哪个R语言扩展包可以创建带有点和边的网络图( )A.ggplot2B.networkC.ggmapsD.animation参考答案:B15. 考虑下面的频繁3-项集的集合:1,2,3,1,2,4,1,2,5,1,3,4,1,3,5,2,3,4,2,3,5,3,4,5;假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含( )。A.1,2,3,4B.1,2,3,5C.1,2,4,5D.1,3,4,

5、5参考答案:C16. 在k近邻法中,选择较小的k值时,学习的“近似误差”会( ),“估计误差”会( )。A.减小,减小B.减小,增大C.增大,减小D.增大,增大参考答案:B17. 网民在搜索引擎输入关键词后,搜索引擎会返回的三大类相关信息是( )A:搜索引擎检索库中相关的网民在搜索引擎输入关键词后,搜索引擎会返回的三大类相关信息是( )A:搜索引擎检索库中相关的信息B:付费的推广信息C:开放平台信息D:网盟推广信息答案:ABC18. continue语句只结束本次循环,而不终止整个循环;break语句结束整个循环过程。( )A.正确B.错误参考答案:A19. 下面例子属于分类的是( )。A.检

6、测图像中是否有人脸出现B.对客户按照贷款风险大小进行分类C.识别手写的数字D.估计商场客流量参考答案:ABC20. 数据规约是在尽可能保持数据原貌的前提下,最大限度地精简数据量。( )T.对F.错参考答案:T21. k近邻法的基本要素包括( )。A.距离度量B.k值的选择C.样本大小D.分类决策规则参考答案:ABD22. 获取数据为数据分析提供了素材和依据,这里的数据只包括直接获取的数据。( )获取数据为数据分析提供了素材和依据,这里的数据只包括直接获取的数据。( )A.正确B.错误参考答案:B23. 赤池信息准则是衡量统计模型拟合优良性的一种标准。( )A.正确B.错误参考答案:A24. 实

7、体识别属于以下哪个过程?( )A.数据清洗B.数据集成C.数据规约D.数据变换参考答案:B25. FP是一种最有影响的挖掘布尔关联规则频繁项集的算法。( )T.对F.错参考答案:F26. 编写HTML文件不能在哪个软件中编写?( )A.EditB.WordC.WPSD.Windows的画笔参考答案:D27. Python程序可以在任何安装了Python解释器的操作系统环境中执行。( )A.正确B.错误参考答案:A28. 多层感知机的学习过程包含( )。多层感知机的学习过程包含( )。A.信号的正向传播B.信号的反向传播C.误差的正向传播D.误差的反向传播参考答案:AD29. ECR系统由哪些部

8、分组成的?ECR系统由哪些部分组成的?参考答案:ECR系统的基本结构包括两个部分,即基础设施和管理系统,其中,基础设施包括信息系统和物流系统,管理系统包括营销管理和组织革新。30. 当训练集较大的时候,标准BP算法通常会更快的获得更好的解。( )A.正确B.错误参考答案:A31. K-means算法采用贪心策略,通过迭代优化来近似求解。( )A.正确B.错误参考答案:A32. 利用K近邻法进行分类时,使用不同的距离度量所确定的最近邻点都是相同的。( )A.正确B.错误参考答案:B33. 网络营销环境及企业的经营环境都在不断的发展演变中,因此也没有一成不变、永远有效的互联网营销网络营销环境及企业

9、的经营环境都在不断的发展演变中,因此也没有一成不变、永远有效的互联网营销方法,这说明了网络营销发展趋势中的( )A:网络营销将从封闭式向开放式转变B:从企业自有网站为核心到多平台的综合利用C:行业内企业网络营销竞争加剧D:网络营销方法不断调整适应互联网环境发展答案:D34. 在多分支结构中,Python是通过( )来判断语句是否属于一个分支结构中。A.花括号B.冒号C.括号D.缩进参考答案:D35. 宁家骏委员指出,我国发展医疗服务业,同时发展智慧养老。( )T.对F.错参考答案:T36. Intranet有哪些组成部分?Intranet有哪些组成部分?参考答案:主要由物理网、防火墙、服务器(

10、如Web服务器、邮件服务器、数据库服务器等)、客户机等几个基本部分组成。37. k近邻法的基本要素包括( )。A.距离度量B.k值的选择C.样本大小D.分类决策规则参考答案:ABD38. 规划一个C类网,需要将网络分为20个子网,每个子网最多5台主机,下列哪个是合适的子网掩码( )A、255. 255. 255.0。B、 255. 255. 255.224。C、 255. 255. 255.240。D、 255. 255. 255.248参考答案:D39. 以下哪一种数据类型元素之间是无序的,相同元素在集合中唯一存在?( )A.元组B.字符串C.列表D.集合参考答案:D40. 以下选项中,不是

11、Python对文件的打开模式的是( )。A.cB.r+C.wD.r参考答案:A41. for循环和while循环中都存在一个else扩展用法,continue关键字对else没有影响。( )A.正确B.错误参考答案:A42. 数据挖掘方法侧重于从数据驱动的角度出发获取模式或规律。因此,针对海量人类移动数据,数据挖掘方法可以发挥其挖掘模式或规律的长处。( )T.对F.错参考答案:T43. K-means聚类中K值选取的方法是( )。K-means聚类中K值选取的方法是( )。A.密度分类法B.手肘法C.大腿法D.随机选取参考答案:AB44. 信息熵越大,数据信息的不确定性越小。( )A.正确B.

12、错误参考答案:B45. 结构化数据是用excel结构表现的数据。( )T.对F.错参考答案:F46. BFR聚类簇的坐标可以与空间的坐标保持一致。( )A.正确B.错误参考答案:B47. 下列哪一种不是Python的特性?( )A.跨平台特性B.解释型语言C.编译型语言D.面向对象参考答案:C48. 组合数据类型中的序列类型元素之间存在先后关系,可以通过序号访问。( )A.正确B.错误参考答案:A49. 数据变换(Data Transformation)就是把原始数据转化为适合于数据挖掘的数据形式。( )T.对F.错参考答案:T50. 在一元线性回归中,通过最小二乘法求得的直线叫做回归直线或(

13、 )。A.最优回归线B.最优分布线C.最优预测线D.最佳分布线参考答案:A51. 一元线性回归中,真实值与预测值的差称为样本的( )。A.误差B.方差C.测差D.残差参考答案:D52. 特征选择和降维都是用于减少特征数量,进而降低模型复杂度、防止过度拟合。( )A.正确B.错误参考答案:A53. 医疗大数据特点:除了包含了大数据4个“V”的特点之外还有( )A.多态性B.时效性C.不完整性D.冗余性参考答案:ABCD54. 多层感知机的学习能力有限,只能处理线性可分的二分类问题。( )A.正确B.错误参考答案:B55. 商业智能(BI)可以被描述为“一组用于获取原始数据,并将其转换为用于业务分析目的,有意义且有用的信息的技术和工具”。( )T.对F.错参考答案:T56. 网络营销规划的步骤依次是( )A:制定网络营销目标、评估企业外部环境、定位网络营销形象、安排预网络营销规划的步骤依次是( )A:制定网络营销目标

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号