南开大学21秋《网络爬虫与信息提取》复习考核试题库答案参考套卷17

上传人:ni****g 文档编号:456349184 上传时间:2023-09-17 格式:DOCX 页数:11 大小:12.90KB
返回 下载 相关 举报
南开大学21秋《网络爬虫与信息提取》复习考核试题库答案参考套卷17_第1页
第1页 / 共11页
南开大学21秋《网络爬虫与信息提取》复习考核试题库答案参考套卷17_第2页
第2页 / 共11页
南开大学21秋《网络爬虫与信息提取》复习考核试题库答案参考套卷17_第3页
第3页 / 共11页
南开大学21秋《网络爬虫与信息提取》复习考核试题库答案参考套卷17_第4页
第4页 / 共11页
南开大学21秋《网络爬虫与信息提取》复习考核试题库答案参考套卷17_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《南开大学21秋《网络爬虫与信息提取》复习考核试题库答案参考套卷17》由会员分享,可在线阅读,更多相关《南开大学21秋《网络爬虫与信息提取》复习考核试题库答案参考套卷17(11页珍藏版)》请在金锄头文库上搜索。

1、南开大学21秋网络爬虫与信息提取复习考核试题库答案参考1. 如果通过爬虫抓取某公司网站的公开数据,分析以后发现这个公司业绩非常好。于是将数据或者分析结果出售给某基金公司,从而获得销售收入。这是合法的。( )A.正确B.错误参考答案:A2. 爬虫中间件的激活需要另外写一个文件来进行。( )A.正确B.错误参考答案:B3. “curl http:/爬虫服务器IP地址:6800/cancel.json-d project=工程名-d job=爬虫JOBID”该命令的作用是启动爬虫。( )A.正确B.错误参考答案:B4. 使用Charles,可以轻松截获手机App和微信小程序的数据包,从而开发出直接抓

2、取App后台和小程序后台的爬虫。( )使用Charles,可以轻松截获手机App和微信小程序的数据包,从而开发出直接抓取App后台和小程序后台的爬虫。( )A.正确B.错误参考答案:A5. 如果把网络上发送与接收的数据包理解为快递包裹,那么在快递运输的过程中取出查看更改里面的内容,就是类似抓包的过程。( )T.对F.错参考答案:F6. Python中写CSV文件的writerows方法参数为字典类型。( )T.对F.错参考答案:F7. 下列关于在IOS上配置charles的说法正确的是( )下列关于在IOS上配置charles的说法正确的是( )A.不同ios设备之间会有比较大的差别,所以配置

3、的时候需要找到对应的安装证书的入口B.手机和电脑需要在同一个局域网下C.HTTP代理可以使用“自动”选项D.安装好证书以后,打开iOS设备上的任何一个App,可以看到Charles中有数据包在流动参考答案:BD8. 使用python定制mitmproxy,下面的语句请求的是( )。req.headersUser-Agent使用python定制mitmproxy,下面的语句请求的是( )。req.headersUser-AgentA.headersB.文本内容C.目标网站D.user-agent参考答案:D9. PyMongoDB中排序方法sort第二个参数1表示降序。( )T.对F.错参考答案

4、:F10. Redis中使用lrange读取数据后数据也会删除。( )A.正确B.错误参考答案:B11. Python可以将列表或字典转换成Json字符串。( )T.对F.错参考答案:T12. 在MacOS下若要运行Redis可以运行解压以后的文件夹下面的src文件夹中的redis-server文件启动redis服务 src/redis-server。( )在MacOS下若要运行Redis可以运行解压以后的文件夹下面的src文件夹中的redis-server文件启动redis服务 src/redis-server。( )A.正确B.错误参考答案:B13. Python中列表生成以后还可以往里面

5、继续添加数据,也可以从里面删除数据。( )T.对F.错参考答案:T14. 网站返回的Headers中经常有Cookies,可以用mitmdump脚本使用print函数把Cookies打印出来。( )T.对F.错参考答案:F15. 数据抓包就是中间人爬虫的一个简单应用。所以使用Charles也是一种中间人攻击。( )数据抓包就是中间人爬虫的一个简单应用。所以使用Charles也是一种中间人攻击。( )A.正确B.错误参考答案:A16. Robo 3T与RoboMongo是完全不一样的软件。( )Robo 3T与RoboMongo是完全不一样的软件。( )A.正确B.错误参考答案:B17. Pyt

6、hon中Object=(1,2,3,4,5),则Objcet是( )。A.列表B.元组C.字典D.集合参考答案:B18. PyMongo中逻辑查询表示大于等于的符号是( )PyMongo中逻辑查询表示大于等于的符号是( )A.$gtB.$ltC.$gteD.$lte参考答案:C19. Python中( )与元组由类似的数据读取方式。A.字符串B.列表C.字典D.集合参考答案:AB20. 爬虫登录需要识别验证码可以先把程序关闭,肉眼识别以后再重新运行。( )A.正确B.错误参考答案:B21. 引用中间件时后面的数字代表的是中间件的执行顺序,例如 AdvanceSpider.middlewares

7、.ProxyMiddleware:543 中的543。( )A.正确B.错误参考答案:A22. PyMongo更新操作有( )。A.updateB.update_allC.update_oneD.update_many参考答案:CD23. 使用UI Automatorr根据坐标来滑动桌面的操作是得到相应控件后使用命令( )。A.swipeB.moveC.scrollD.fly参考答案:A24. 当使用Scarpy创建爬虫时,当爬取网易云音乐首页信息时,scrapy genspider的第二个参数直接输入就可以了。( )当使用Scarpy创建爬虫时,当爬取网易云音乐首页信息时,scrapy ge

8、nspider的第二个参数直接输入就可以了。( )A.正确B.错误参考答案:B25. Charles是一个收费软件,如果没有注册,安装以后的前30天可以正常使用。30天以后,虽然功能不会缩水,但每过30分钟Charles会自动关闭一次。( )T.对F.错参考答案:T26. process_spider_output(response,result,output)是在下载器中间件处理完成后,马上要进入某个回调函数parse_xxx( )前调用。( )A.正确B.错误参考答案:B27. Python中Object=&39;obj_1&39;:&39;1&39;,&39;obj_2&39;:&39;

9、2&39;,则Objcet.get(&39;boj_1&39;,&39;3&39;)是( )Python中Object=obj_1:1,obj_2:2,则Objcet.get(boj_1,3)是( )A.1B.2C.3D.无输出参考答案:A28. 在Mac OS下安装MongoDB使用命令( )install mongodb。A.brewB.apt-getC.sudoD.apt参考答案:A29. PyMongo删除操作有( )PyMongo删除操作有( )A.deleteB.delete_allC.delete_oneD.delete_many参考答案:CD30. 当爬虫创建好了之后,可以使用

10、scrapy( )命令运行爬虫。A.startupB.starwarC.drawlD.crawl参考答案:D31. 以下哪个命令是利用URL语法在命令行下工作的文件传输工具( )以下哪个命令是利用URL语法在命令行下工作的文件传输工具( )A.curlB.tar -zxvfC.mkdirD.cp参考答案:A32. 如果使用Python的数据结构来做类比的话,MongoDB中集合相当于一个( )如果使用Python的数据结构来做类比的话,MongoDB中集合相当于一个( )A.列表B.元组C.字典D.集合参考答案:A33. Python中直接对浮点数进行计算有print(0.1+0.2),则结果

11、为0.3。( )A.正确B.错误参考答案:B34. 已经创建好的Scrapy爬虫*.py文件可以直接通过Python来运行。( )A.正确B.错误参考答案:B35. Python中退出循环应用关键字( )。A.breakB.continueC.exitD.return参考答案:A36. 以下哪个命令是linux下解压缩命令?( )A.curlB.tar-zxvfC.mkdirD.cp参考答案:B37. Charles是一个收费软件,如果没有注册,安装以后的前30天可以正常使用。30天以后,虽然功能不会缩水,但每过30分钟Charles会自动关闭一次。( )A.正确B.错误参考答案:A38. S

12、elenium必须加载对应的webdriver才能模拟浏览器访问。( )Selenium必须加载对应的webdriver才能模拟浏览器访问。( )A.正确B.错误参考答案:A39. PyMongo中逻辑查询表示小于的符号是( )A.$gtB.$ltC.$gte$lte参考答案:B40. 使用BeautifulSoup对象后可以使用( )来查找内容A.find_allB.findC.searchD.search_all参考答案:AB41. MongoDB是一个关系数据库产品。( )MongoDB是一个关系数据库产品。( )A.正确B.错误参考答案:B42. 如果爬虫爬取的是商业网站,并且目标网站

13、使用了反爬虫机制,那么强行突破反爬虫机制可能构成( )。A.非法侵入计算机系统罪B.非法获取计算机信息系统数据罪C.非法获取计算机数据罪D.非法获取系统罪参考答案:AB43. Python中条件语句在使用or连接的多个表达式中,只要有一个表达式为真,那么后面的表达式就不会执行。( )T.对F.错参考答案:T44. MongoDB支持对查询到的结果进行排序。排序的方法为sort( )。它的格式为:handler.find( ).sort(&39;列名&39;, 1或-1或0)。( )MongoDB支持对查询到的结果进行排序。排序的方法为sort( )。它的格式为:handler.find( ).sort(列名, 1或-1或0)。( )A.正确B.错误参考答案:B45. Python中使用下面代码打开文件也需要对文件进行close关闭操作 with open(文件路径,文件操作方式,encoding=utf-8)as f。( )A.正确B.错误参考答案:B46. Redis的集合与Python的集合一样,没有顺序,值不重复。( )Redis的集合与Python的集合一样,没有顺序,值不重复。( )A.正确B.错误参考答案:A47. 通

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号