南开大学21秋《网络爬虫与信息提取》在线作业一答案参考7

上传人:博****1 文档编号:486900992 上传时间:2023-09-10 格式:DOCX 页数:13 大小:13.95KB
返回 下载 相关 举报
南开大学21秋《网络爬虫与信息提取》在线作业一答案参考7_第1页
第1页 / 共13页
南开大学21秋《网络爬虫与信息提取》在线作业一答案参考7_第2页
第2页 / 共13页
南开大学21秋《网络爬虫与信息提取》在线作业一答案参考7_第3页
第3页 / 共13页
南开大学21秋《网络爬虫与信息提取》在线作业一答案参考7_第4页
第4页 / 共13页
南开大学21秋《网络爬虫与信息提取》在线作业一答案参考7_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《南开大学21秋《网络爬虫与信息提取》在线作业一答案参考7》由会员分享,可在线阅读,更多相关《南开大学21秋《网络爬虫与信息提取》在线作业一答案参考7(13页珍藏版)》请在金锄头文库上搜索。

1、南开大学21秋网络爬虫与信息提取在线作业一答案参考1. 当爬虫创建好了之后,可以使用scrapy( )命令运行爬虫。A.startupB.starwarC.drawlD.crawl参考答案:D2. PyMongo中的查找方法的参数是哪种数据结构( )A.列表B.元组C.字典D.集合参考答案:C3. Redis是遵守BSD协议、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库。( )T.对F.错参考答案:T4. Redis插入数据都是插入到列表右侧,因此读取数据也是从右侧读取。( )T.对F.错参考答案:F5. 微信小程序的反爬虫能力要比网页的高很多。( )微信小程序的反爬虫能力

2、要比网页的高很多。( )A.正确B.错误参考答案:B6. 在安装Scarpy的依赖库时,由于Visual C+ Build Tools的安装速度很慢,为了节省时间,可以和安装Twisted同时进行。( )T.对F.错参考答案:F7. PyMongo更新操作有( )。A.updateB.update_allC.update_oneD.update_many参考答案:CD8. Python中条件语句在使用or连接的多个表达式中,只要有一个表达式为真,那么后面的表达式就不会执行。( )T.对F.错参考答案:T9. 在发送请求时需要注意requests提交的请求头不能与浏览器的请求头一致,因为这样才能

3、隐藏好自己达到获取数据的目的。( )A.正确B.错误参考答案:B10. device.sleep( )方法是使用UI Automatorr关闭屏幕的命令。( )A.正确B.错误参考答案:A11. Python中跳过本次循环应用关键字( )A.breakB.continueC.exitD.return参考答案:B12. Cookies一般包含在请求头Headers中。( )T.对F.错参考答案:T13. 如果目标网站有反爬虫声明,那么对方在被爬虫爬取以后,可以根据( )来起诉使用爬虫的公司。A.服务器日志B.数据库日志记录C.程序日志记录D.服务器监控参考答案:ABCD14. Redis中从集合

4、中查看有多少个值,用关键字( )。A.scardB.cardC.countD.distinct参考答案:A15. Redis中使用lrange读取数据后数据也会删除。( )A.正确B.错误参考答案:B16. UI Automator Viewer与Python uiautomator可以同时使用。( )A.正确B.错误参考答案:B17. 已经创建好的Scrapy爬虫*.py文件可以直接通过Python来运行。( )A.正确B.错误参考答案:B18. 采用以下( )技术可以实现异步加载A.HTMLB.AJAXC.CSSD.HTTP参考答案:B19. 当需要把Python里面的数据发送给网页时,应

5、先将其转换成( )当需要把Python里面的数据发送给网页时,应先将其转换成( )A.Json字符串B.GETC.POSTD.Request参考答案:A20. 在使用多线程处理问题时,线程池设置越大越好。( )A.正确B.错误参考答案:B21. HTTP状态码302表示资源永久重定向。( )T.对F.错参考答案:F22. 如果通过爬虫抓取某公司网站的公开数据,分析以后发现这个公司业绩非常好。于是将数据或者分析结果出售给某基金公司,从而获得销售收入。这是合法的。( )A.正确B.错误参考答案:A23. 在MacOS下若要运行Redis可以运行解压以后的文件夹下面的src文件夹中的redis-se

6、rver文件启动redis服务src/redis-server。( )T.对F.错参考答案:F24. Charles和Chrome开发者工具相比,只是多了一个搜索功能。( )A.正确B.错误参考答案:B25. 使用UI Automatorr输入文字的操作是得到相应控件后使用命令( )使用UI Automatorr输入文字的操作是得到相应控件后使用命令( )A.settextB.setC.set_textD.text参考答案:C26. MongoDB 是一个基于分布式文件存储的数据库,速度远快过Redis。( )A.对B.错参考答案:B27. Python中Object=obj_1:1,obj_

7、2:2,则Objcet.get(boj_3,3)是( )。A.1B.2C.3D.无输出参考答案:C28. 引用中间件时后面的数字代表的是中间件的执行顺序,例如 &39;AdvanceSpider.middlewares.ProxyMiddleware&39;: 543中的543。( )T.对F.错参考答案:T29. 自己能查看的数据,允许擅自拿给第三方查看。( )T.对F.错参考答案:F30. 虽然MongoDB相比于MySQL来说,速度快了很多,但是频繁读写MongoDB还是会严重拖慢程序的执行速度。( )A.正确B.错误参考答案:A31. PyMongo中逻辑查询表示小于的符号是( )A.

8、$gtB.$ltC.$gte$lte参考答案:B32. Python操作CSV文件可通过( )容器的方式操作单元格。A.列表B.元组C.字典D.集合参考答案:C33. 当爬虫创建好了之后,可以使用“scrapy( )”命令运行爬虫。A.startupB.starwarC.drawlD.crawl参考答案:D34. MongoDB中获取名字为set1的集合的语句为( )MongoDB中获取名字为set1的集合的语句为( )A.database.set1B.database(set1)C.databaseset1D.databaseset1参考答案:AC35. process_spider_inp

9、ut(response,spider)是在爬虫运行yield item或者yield scrapy.Request( )的时候调用。( )A.正确B.错误参考答案:B36. requests中get请求方法的使用为requests.get(网址, data=data)。( )T.对F.错参考答案:F37. Python中( )容器有推导式Python中( )容器有推导式A.列表B.元组C.字典D.集合参考答案:ACD38. Python中退出循环应用关键字( )。A.breakB.continueC.exitD.return参考答案:A39. 安装mitmdump之前,运行sudo apt-g

10、et install python3-dev python3-pip libffi-dev libssl-dev是为了安装必要的运行环境。( )T.对F.错参考答案:T40. Redis中查询列表长度命令llen中l代表left,即从左侧开始数。( )A.正确B.错误参考答案:B41. 在Windows中下若要运行Redis可以运行redis-server/usr/local/etc/redis.conf。( )T.对F.错参考答案:F42. 通用搜索引擎大多提供基于关键字的检索,难以支持根据语义信息提出的查询。( )T.对F.错参考答案:T43. 下列关于mitmproxy的安装说法错误的是

11、( )下列关于mitmproxy的安装说法错误的是( )A.对于Mac OS系统,使用Homebrew安装mitmproxy,命令为:brew install mitmproxyB.在Ubuntu中,要安装mitmproxy,首先需要保证系统的Python为Python3.5或者更高版本C.在windows系统中无法使用linux的命令,只能通过下载安装包来安装D.UBUNTU中执行命令 sudo pip3 install mitmproxy 进行安装参考答案:C44. 下面代码一共执行循环多少次( ): for i in range(10): print(i * i)A.9B.10C.11D

12、.0参考答案:B45. 在MacOS下若要运行Redis可以运行解压以后的文件夹下面的src文件夹中的redis-server文件启动redis服务 src/redis-server。( )在MacOS下若要运行Redis可以运行解压以后的文件夹下面的src文件夹中的redis-server文件启动redis服务 src/redis-server。( )A.正确B.错误参考答案:B46. 设置了这个中间件以后,仍然需要输入账号密码可以成功得到登录以后才能看到的HTML。( )A.正确B.错误参考答案:B47. PyMongo中逻辑查询表示不等于的符号是( )。A.$neB.$ltC.$gtD.

13、$eq参考答案:A48. cookies的缺点是( )。A.实现自动登录B.跟踪用户状态C.http中明文传输D.增加http请求的流量参考答案:CD49. 一个可行的自动更换代理的爬虫系统,应该下列哪些功能?( )A.有一个小爬虫ProxySpider去各大代理网站爬取免费代理并验证,将可以使用的代理IP保存到数据库中B.在发现某个请求已经被设置过代理后,什么也不做,直接返回C.在ProxyMiddlerware的process_request中,每次从数据库里面随机选择一条代理IP地址使用D.周期性验证数据库中的无效代理,及时将其删除参考答案:ACD50. requests中post请求方法的使用为requests.post(网址, data=data)中的data为( )。A.列表B.元组C.字典D.集合参考答案:C51. Python中若定义object=(1,2,3,4,5),则print(object:3)输出( )。A.345B.34C.45D.123参考答案:C52. 为了在安卓手机上安装证书,需要先发送证书到手机里面。在Char

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号