南开大学21秋《网络爬虫与信息提取》在线作业一答案参考37

上传人:壹****1 文档编号:469414786 上传时间:2022-12-19 格式:DOCX 页数:13 大小:13.82KB
返回 下载 相关 举报
南开大学21秋《网络爬虫与信息提取》在线作业一答案参考37_第1页
第1页 / 共13页
南开大学21秋《网络爬虫与信息提取》在线作业一答案参考37_第2页
第2页 / 共13页
南开大学21秋《网络爬虫与信息提取》在线作业一答案参考37_第3页
第3页 / 共13页
南开大学21秋《网络爬虫与信息提取》在线作业一答案参考37_第4页
第4页 / 共13页
南开大学21秋《网络爬虫与信息提取》在线作业一答案参考37_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《南开大学21秋《网络爬虫与信息提取》在线作业一答案参考37》由会员分享,可在线阅读,更多相关《南开大学21秋《网络爬虫与信息提取》在线作业一答案参考37(13页珍藏版)》请在金锄头文库上搜索。

1、南开大学21秋网络爬虫与信息提取在线作业一答案参考1. PyMongo中逻辑查询表示不等于的符号是( )PyMongo中逻辑查询表示不等于的符号是( )A.$gtB.$ltC.$eqD.$ne参考答案:C2. 当需要把Python里面的数据发送给网页时,应先将其转换成( )当需要把Python里面的数据发送给网页时,应先将其转换成( )A.Json字符串B.GETC.POSTD.Request参考答案:A3. MongoDB URI的格式为:mongodb:/服务器IP或域名:端口用户名:密码。( )MongoDB URI的格式为:mongodb:/服务器IP或域名:端口用户名:密码。( )A

2、.正确B.错误参考答案:B4. MongoDB是一个关系数据库产品。( )MongoDB是一个关系数据库产品。( )A.正确B.错误参考答案:B5. 爬虫的源代码通过公开不会对被爬虫网站造成影响。( )A.正确B.错误参考答案:B6. Python并导入uiautomator来操作设备的语句是from uiautomator import( )。A.DeviceB.DevicesC.JobsD.Job参考答案:A7. BS4可以用来从( )中提取数据A.HTMLB.XMLC.数据库D.JSON参考答案:AB8. 如果通过爬虫抓取某公司网站的公开数据,分析以后发现这个公司业绩非常好,于是买入该公

3、司股票并赚了一笔钱。这是合法的。( )A.正确B.错误参考答案:A9. Redis中使用lrange读取数据后数据也会删除。( )A.正确B.错误参考答案:B10. 爬虫登录需要识别验证码可以先把程序关闭,肉眼识别以后再重新运行。( )A.正确B.错误参考答案:B11. Python中有哪些实现多线程方法( )Python中有哪些实现多线程方法( )A.multiprocess.dummyB.threading.ThreadC.processD.PyMongoDB参考答案:AB12. 下面Python代码输出为:( )def default_para_without_trap(para=,va

4、lue=0):if not para:par下面Python代码输出为:( )def default_para_without_trap(para=,value=0):if not para:para=para.append(value)return para print(第一步:.format(default_para_trap(value=100) print(第二步:.format(default_para_trap(value=50)A.第一步:100第二步:100,50B.第一步:100第二步:50C.第一步:100第二步:D.第一步:100第二步:100参考答案:B13. 网站返回

5、的Headers中经常有Cookies,可以用mitmdump脚本使用print函数把Cookies打印出来。( )T.对F.错参考答案:F14. 使用UI Automator使屏幕向上滚动一屏的操作是得到相应控件后使用命令scroll.vert.forward。( )A.正确B.错误参考答案:B15. 所有的异步加载都会向后台发送请求。( )T.对F.错参考答案:F16. 请问按哪个键可以打开Chrome自带的开发者工具( )请问按哪个键可以打开Chrome自带的开发者工具( )A.F10B.F1C.F11D.F12参考答案:D17. PyMongo中的查找方法的参数是哪种数据结构( )A.

6、列表B.元组C.字典D.集合参考答案:C18. Redis中列表读取数据命令lrange中l代表left,即从左侧开始读取。( )Redis中列表读取数据命令lrange中l代表left,即从左侧开始读取。( )A.正确B.错误参考答案:B19. Python中列表生成以后还可以往里面继续添加数据,也可以从里面删除数据。( )A.正确B.错误参考答案:A20. Cookies一般包含在请求头Headers中。( )A.正确B.错误参考答案:A21. Redis中往集合中读数据,使用关键字( )A.popB.spopC.lpopD.range参考答案:B22. Python中若定义object=

7、“12345”,则print(object:-1)输出( )。A.1B.5C.54321D.程序报错参考答案:C23. 在Linux的终端使用apt-get命令安装一系列依赖库时,其中如果存在有已经安装的库,会覆盖掉之前的库重新安装。( )A.正确B.错误参考答案:B24. ( )是Scrapy官方开发的,用来部署、运行和管理Scrapy爬虫的工具。A.ScrapydB.ScrapyDeployC.DeployD.Scrapy_Deploy参考答案:A25. 采用以下( )技术可以实现异步加载A.HTMLB.AJAXC.CSSD.HTTP参考答案:B26. Python中Object=(1,2

8、,3,4,5),则Objcet是( )。A.列表B.元组C.字典D.集合参考答案:B27. Python中相比于findall方法,search方法对于从超级大的文本里面只找第1个数据特别有用,可以大大提高程序的运行效率。( )T.对F.错参考答案:T28. 在安装Scarpy的依赖库时,由于Visual C+ Build Tools的安装速度很慢,为了节省时间,可以和安装Twisted同时进行。( )T.对F.错参考答案:F29. 当运行爬虫代码后,出现“Forbidden by robots.txt”提示后,说明当前时间段被爬取的网站无法访问。( )当运行爬虫代码后,出现“Forbidde

9、n by robots.txt”提示后,说明当前时间段被爬取的网站无法访问。( )A.正确B.错误参考答案:B30. Python中列表生成以后还可以往里面继续添加数据,也可以从里面删除数据。( )Python中列表生成以后还可以往里面继续添加数据,也可以从里面删除数据。( )A.正确B.错误参考答案:A31. ( )是一个传递信息的通道。它负责将爬取博文列表页获取到的信息传递给负责爬取正文页的方法中。( )是一个传递信息的通道。它负责将爬取博文列表页获取到的信息传递给负责爬取正文页的方法中。A.metaB.headC.headerD.body参考答案:A32. Redis中从集合中查看有多少

10、个值,用关键字( )。A.scardB.cardC.countD.distinct参考答案:A33. 最常见的HTTP请求类型有( )最常见的HTTP请求类型有( )A.GETB.POSTC.SENDD.RECEIVE参考答案:AB34. Python中跳过本次循环应用关键字( )A.breakB.continueC.exitD.return参考答案:B35. PyMongo中逻辑查询表示小于等于的符号是( )A.$gtB.$ltC.$gte$lte参考答案:C36. RoboMongo是MongoDB的管理软件。( )T.对F.错参考答案:T37. HTTP常用状态码表明请求被正常处理的有(

11、 )。A.200B.301C.302D.204参考答案:AD38. MongoDB支持对查询到的结果进行排序。排序的方法为sort( )。它的格式为:handler.find( ).sort(&39;列名&39;, 1或-1或0)。( )MongoDB支持对查询到的结果进行排序。排序的方法为sort( )。它的格式为:handler.find( ).sort(列名, 1或-1或0)。( )A.正确B.错误参考答案:B39. HTTP常用状态码表明服务器正忙的是( )。A.500B.503C.403D.404参考答案:B40. device.sleep( )方法是使用UI Automatorr关

12、闭屏幕的命令。( )A.正确B.错误参考答案:A41. Python中把集合转换为列表需要使用( )函数。A.setB.listC.convertD.change参考答案:B42. 在发送请求时需要注意requests提交的请求头不能与浏览器的请求头一致,因为这样才能隐藏好自己达到获取数据的目的。( )T.对F.错参考答案:F43. Python正则表达式中“.*”是贪婪模式,获取最长的满足条件的字符串。( )A.正确B.错误参考答案:A44. 使用UI Automatorr让屏幕向右滚动的操作是得到相应控件后使用命令scroll.horiz.forward( )。( )T.对F.错参考答案:

13、F45. 一般来说在页面都通过GET将用户登录信息传递到服务器端。( )A.正确B.错误参考答案:B46. HTTP常用状态码表明表明客户端是发生错误的原因所在的有( )。A.403B.404C.500D.503参考答案:AB47. Python中字符串切片以后的结果还是字符串。( )Python中字符串切片以后的结果还是字符串。( )A.正确B.错误参考答案:A48. charles配置中,安装完成证书以后,在设置中打开“关于本机”,找到最下面的“证书信任设置”,并在里面启动对Charles证书的完全信任。( )charles配置中,安装完成证书以后,在设置中打开“关于本机”,找到最下面的“证书信任设置”,并在里面启动对Charles证书的完全信任。( )A.正确B.错误参考答案:A49. PyMongoDB中排序方法sort第二个参数1表示降序。( )T.对F.错参考答案:F50. 在Mac OS下安装MongoDB使用命令( )install mongodb。A.brewB.apt-getC.sudoD.apt

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号