南开大学21秋《网络爬虫与信息提取》在线作业二满分答案94

上传人:工**** 文档编号:488603412 上传时间:2023-04-02 格式:DOCX 页数:13 大小:13.43KB
返回 下载 相关 举报
南开大学21秋《网络爬虫与信息提取》在线作业二满分答案94_第1页
第1页 / 共13页
南开大学21秋《网络爬虫与信息提取》在线作业二满分答案94_第2页
第2页 / 共13页
南开大学21秋《网络爬虫与信息提取》在线作业二满分答案94_第3页
第3页 / 共13页
南开大学21秋《网络爬虫与信息提取》在线作业二满分答案94_第4页
第4页 / 共13页
南开大学21秋《网络爬虫与信息提取》在线作业二满分答案94_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《南开大学21秋《网络爬虫与信息提取》在线作业二满分答案94》由会员分享,可在线阅读,更多相关《南开大学21秋《网络爬虫与信息提取》在线作业二满分答案94(13页珍藏版)》请在金锄头文库上搜索。

1、南开大学21秋网络爬虫与信息提取在线作业二满分答案1. PyMongo中逻辑查询表示小于的符号是( )A.$gtB.$ltC.$gte$lte参考答案:B2. ( )是Scrapy官方开发的,用来部署、运行和管理Scrapy爬虫的工具。( )是Scrapy官方开发的,用来部署、运行和管理Scrapy爬虫的工具。A.ScrapydB.ScrapyDeployC.DeployD.Scrapy_Deploy参考答案:A3. 以下哪个命令是利用URL语法在命令行下工作的文件传输工具( )以下哪个命令是利用URL语法在命令行下工作的文件传输工具( )A.curlB.tar -zxvfC.mkdirD.c

2、p参考答案:A4. Python中线程池map( )方法第二个参数是( )Python中线程池map( )方法第二个参数是( )A.列表B.元组C.字典D.集合参考答案:A5. 爬虫中间件的激活需要另外写一个文件来进行。( )A.正确B.错误参考答案:B6. Python可以将列表或字典转换成Json字符串。( )T.对F.错参考答案:T7. 通用搜索引擎的目标是尽可能大的网络覆盖率,搜索引擎服务器资源与网络数据资源互相匹配。( )A.正确B.错误参考答案:B8. Charles是一个收费软件,如果没有注册,安装以后的前30天可以正常使用。30天以后,虽然功能不会缩水,但每过30分钟Charl

3、es会自动关闭一次。( )T.对F.错参考答案:T9. PyMongoDB中排序方法sort第二个参数1表示降序。( )T.对F.错参考答案:F10. Python中若定义object=12345,则print(object:-1)输出( )Python中若定义object=12345,则print(object:-1)输出( )A.1B.5C.54321D.程序报错参考答案:C11. 开源库pytesseract的作用是将图像中文字转换为文本。( )A.正确B.错误参考答案:A12. Python中Object=&39;obj_1&39;:&39;1&39;,&39;obj_2&39;:&3

4、9;2&39;,则Objcet.get(&39;boj_3&39;,&39;3&39;)是( )A.1B.2C.3D.无输出参考答案:C13. Redis的集合与Python的集合一样,没有顺序,值不重复。( )Redis的集合与Python的集合一样,没有顺序,值不重复。( )A.正确B.错误参考答案:A14. 数据抓包就是中间人爬虫的一个简单应用。所以使用Charles也是一种中间人攻击。( )数据抓包就是中间人爬虫的一个简单应用。所以使用Charles也是一种中间人攻击。( )A.正确B.错误参考答案:A15. PyMongo中逻辑查询表示大于的符号是( )PyMongo中逻辑查询表示大

5、于的符号是( )A.$gtB.$ltC.$gte$lte参考答案:A16. 使用python定制mitmproxy,下面的语句请求的是( )。req.headersUser-Agent使用python定制mitmproxy,下面的语句请求的是( )。req.headersUser-AgentA.headersB.文本内容C.目标网站D.user-agent参考答案:D17. process_spider_output(response,result,output)是在下载器中间件处理完成后,马上要进入某个回调函数parse_xxx( )前调用。( )A.正确B.错误参考答案:B18. Pyth

6、on中( )容器有推导式Python中( )容器有推导式A.列表B.元组C.字典D.集合参考答案:ACD19. Python中哪种容器一旦生成就不能修改?( )A.列表B.元组C.字典D.集合参考答案:B20. scrapy与selenium结合可以实现直接处理需要异步加载的页面。( )T.对F.错参考答案:T21. 以下表示请求正常处理的HTTP状态码为( )以下表示请求正常处理的HTTP状态码为( )A.200B.301C.404D.500参考答案:A22. 使用UI Automatorr操作实体键的命令为device.press.实体按键名称。( )使用UI Automatorr操作实体

7、键的命令为device.press.实体按键名称。( )A.正确B.错误参考答案:A23. 在安装Scarpy的依赖库时,由于Visual C+ Build Tools的安装速度很慢,为了节省时间,可以和安装Twisted同时进行。( )T.对F.错参考答案:F24. 可以通过( )绕过网站登录。A.sessionB.cookiesC.moonpiesD.localstorage参考答案:B25. charles配置中,安装完成证书以后,在设置中打开“关于本机”,找到最下面的“证书信任设置”,并在里面启动对Charles证书的完全信任。( )charles配置中,安装完成证书以后,在设置中打开

8、“关于本机”,找到最下面的“证书信任设置”,并在里面启动对Charles证书的完全信任。( )A.正确B.错误参考答案:A26. 自己能查看的数据,允许擅自拿给第三方查看。( )T.对F.错参考答案:F27. cookies在http请求中是明文传输的。( )cookies在http请求中是明文传输的。( )A.正确B.错误参考答案:A28. 请问按哪个键可以打开Chrome自带的开发者工具( )请问按哪个键可以打开Chrome自带的开发者工具( )A.F10B.F1C.F11D.F12参考答案:D29. 引用中间件时后面的数字代表的是中间件的执行顺序,例如 AdvanceSpider.mid

9、dlewares.ProxyMiddleware:543 中的543。( )A.正确B.错误参考答案:A30. 如果通过爬虫抓取某公司网站的公开数据,分析以后发现这个公司业绩非常好,于是买入该公司股票并赚了一笔钱。这是合法的。( )如果通过爬虫抓取某公司网站的公开数据,分析以后发现这个公司业绩非常好,于是买入该公司股票并赚了一笔钱。这是合法的。( )A.正确B.错误参考答案:A31. Python中列表生成以后还可以往里面继续添加数据,也可以从里面删除数据。( )Python中列表生成以后还可以往里面继续添加数据,也可以从里面删除数据。( )A.正确B.错误参考答案:A32. Redis中使用

10、lrange读取数据后数据也会删除。( )A.正确B.错误参考答案:B33. 使用UI Automator获滚动屏幕的操作是得到相应控件后使用命令( )A.scrollB.scroll_upC.scroll_forwordD.scroll_back参考答案:A34. 服务器端记录信息确定用户身份的数据是( )。A.sessionB.cookiesC.moonpiesD.localstorage参考答案:A35. 如果使用Python的数据结构来做类比的话,MongoDB中库相当于一个( )。A.列表B.元组C.字典D.集合参考答案:C36. Redis中从集合中查看有多少个值,用关键字( )。

11、A.scardB.cardC.countD.distinct参考答案:A37. Python中包含字典的列表页可以转换成JSON字符串。( )Python中包含字典的列表页可以转换成JSON字符串。( )A.正确B.错误参考答案:A38. Python中列表生成以后还可以往里面继续添加数据,也可以从里面删除数据。( )T.对F.错参考答案:T39. 采用以下( )技术可以实现异步加载A.HTMLB.AJAXC.CSSD.HTTP参考答案:B40. 常用的会话跟踪技术是( )A.sessionB.cookiesC.moonpiesD.localstorage参考答案:AB41. Python中直

12、接对浮点数进行计算有print(0.1+0.2),则结果为0.3。( )A.正确B.错误参考答案:B42. 通用网络爬虫通常采用串行工作方式。( )A.正确B.错误参考答案:B43. 当需要把Python里面的数据发送给网页时,应先将其转换成( )当需要把Python里面的数据发送给网页时,应先将其转换成( )A.Json字符串B.GETC.POSTD.Request参考答案:A44. 所有的异步加载都会向后台发送请求。( )T.对F.错参考答案:F45. HTTP常用状态码表明请求被正常处理的有( )。A.200B.301C.302D.204参考答案:AD46. HTTP常用状态码表明服务器

13、上没有请求的资源的是( )A.500B.503C.403D.404参考答案:D47. Charles和Chrome开发者工具相比,只是多了一个搜索功能。( )A.正确B.错误参考答案:B48. lxml库中etree模块的( )方法把Selector对象转换为bytes型的源代码数据。A.etree.tostringB.etree.convertBytesC.etree.toBytesD.etree.convertstring参考答案:A49. MongoDB中获取名字为db的库的语句为( )A.client.dbB.client(db)C.clientdbD.clientdb参考答案:AC50. Python中条件语句在使用or连接的多个表达式中,只要有一个表达式为真,那么后面的表达式就不会执行。( )Python中条件语句在使用or连接的多个表达式中,只要有一个表达式为真,那么后面的表达式就不会执行。( )A.正确B.错误参考答案:A51. 使用UI Automatorr输入文字的操作是得

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号