南开大学21秋《网络爬虫与信息提取》平时作业二参考答案54

上传人:M****1 文档编号:463910521 上传时间:2023-10-25 格式:DOCX 页数:14 大小:13.95KB
返回 下载 相关 举报
南开大学21秋《网络爬虫与信息提取》平时作业二参考答案54_第1页
第1页 / 共14页
南开大学21秋《网络爬虫与信息提取》平时作业二参考答案54_第2页
第2页 / 共14页
南开大学21秋《网络爬虫与信息提取》平时作业二参考答案54_第3页
第3页 / 共14页
南开大学21秋《网络爬虫与信息提取》平时作业二参考答案54_第4页
第4页 / 共14页
南开大学21秋《网络爬虫与信息提取》平时作业二参考答案54_第5页
第5页 / 共14页
点击查看更多>>
资源描述

《南开大学21秋《网络爬虫与信息提取》平时作业二参考答案54》由会员分享,可在线阅读,更多相关《南开大学21秋《网络爬虫与信息提取》平时作业二参考答案54(14页珍藏版)》请在金锄头文库上搜索。

1、南开大学21秋网络爬虫与信息提取平时作业二参考答案1. 在Mac OS下安装MongoDB使用命令( )install mongodb。A.brewB.apt-getC.sudoD.apt参考答案:A2. Python并导入uiautomator来操作设备的语句是from uiautomator import( )。A.DeviceB.DevicesC.JobsD.Job参考答案:A3. Python中Object=&39;obj_1&39;:&39;1&39;,&39;obj_2&39;:&39;2&39;,则Objcet.get(&39;boj_3&39;,&39;3&39;)是( )A.

2、1B.2C.3D.无输出参考答案:C4. requests中get请求方法的使用为requests.get(网址, data=data)。( )T.对F.错参考答案:F5. HTTP常用状态码表明表明客户端是发生错误的原因所在的有( )。A.403B.404C.500D.503参考答案:AB6. 通常使用( )工具来模拟浏览器进行爬虫请求A.SeleniumB.ChromeC.ChromeDriverD.WebDriver参考答案:A7. 在Scrapy的目录下,哪个文件负责存放爬虫的各种配置信息?( )A.spiders文件夹B.item.pyC.pipeline.pyD.settings.

3、py参考答案:D8. 以下表示请求资源找不到的HTTP状态码为( )以下表示请求资源找不到的HTTP状态码为( )A.200B.301C.404D.500参考答案:C9. PyMongo中逻辑查询表示大于的符号是( )PyMongo中逻辑查询表示大于的符号是( )A.$gtB.$ltC.$gte$lte参考答案:A10. 数据抓包就是中间人爬虫的一个简单应用。所以使用Charles也是一种中间人攻击。( )T.对F.错参考答案:T11. 通用网络爬虫通常采用串行工作方式。( )A.正确B.错误参考答案:B12. Charles和Chrome开发者工具相比,只是多了一个搜索功能。( )T.对F.

4、错参考答案:F13. Python正则表达式模块的findall方法如果没有匹配到结果,则返回结果为( )A.空B.空列表C.空元组D.不返回参考答案:B14. MongoDB是一个关系数据库产品。( )MongoDB是一个关系数据库产品。( )A.正确B.错误参考答案:B15. Python中一个函数可以有( )个return语句。Python中一个函数可以有( )个return语句。A.0B.1C.多个D.2参考答案:ABCD16. 当需要把Python里面的数据发送给网页时,应先将其转换成( )当需要把Python里面的数据发送给网页时,应先将其转换成( )A.Json字符串B.GETC

5、.POSTD.Request参考答案:A17. Python中条件语句在使用or连接的多个表达式中,只要有一个表达式为真,那么后面的表达式就不会执行。( )T.对F.错参考答案:T18. 使用python定制mitmproxy,下面的语句请求的是( )。req.headersUser-Agent使用python定制mitmproxy,下面的语句请求的是( )。req.headersUser-AgentA.headersB.文本内容C.目标网站D.user-agent参考答案:D19. 使用BeautifulSoup对象后可以使用( )来查找内容A.find_allB.findC.searchD

6、.search_all参考答案:AB20. Python中把列表转换为集合需要使用( )函数Python中把列表转换为集合需要使用( )函数A.setB.listC.convertD.change参考答案:A21. UI Automator Viewer与Python uiautomator可以同时使用。( )A.正确B.错误参考答案:B22. Python中定义函数关键字为( )。A.defB.defineC.funcD.function参考答案:A23. cookies在http请求中是明文传输的。( )T.对F.错参考答案:T24. 使用UI Automator使屏幕向上滚动一屏的操作是

7、得到相应控件后使用命令scroll.vert.forward。( )A.正确B.错误参考答案:B25. Python可以将列表或字典转换成Json字符串。( )T.对F.错参考答案:T26. Python中以下哪个容器里的元素不能重复( )A.列表B.元组C.字典D.集合参考答案:D27. 如果很多爬虫同时对一个网站全速爬取,那么其实就是对网站进行了( )攻击。A.XSSB.DOSC.DDOSD.跨域参考答案:C28. 使用异步加载技术的网站,被加载的内容可以在源代码中找到。( )T.对F.错参考答案:F29. Scrapy_redis是Scrapy的“( )”,它已经封装了使用Scrapy操

8、作Redis的各个方法。Scrapy_redis是Scrapy的“( )”,它已经封装了使用Scrapy操作Redis的各个方法。A.组件B.模块C.控件D.单元参考答案:A30. 使用UI Automatorr点亮屏幕的操作是得到相应控件后使用命令( )。A.wakeupB.lightC.brightD.sleep参考答案:A31. PyMongo中逻辑查询表示不等于的符号是( )。A.$neB.$ltC.$gtD.$eq参考答案:A32. scrapy与selenium结合可以实现直接处理需要异步加载的页面。( )T.对F.错参考答案:T33. 在MacOS下若要运行Redis可以运行解压

9、以后的文件夹下面的src文件夹中的redis-server文件启动redis服务src/redis-server。( )T.对F.错参考答案:F34. 要使用tesseract来进行图像识别,需要安装两个第三方库( )要使用tesseract来进行图像识别,需要安装两个第三方库( )A.requestsB.beautifulsoupC.PillowD.pytesseract参考答案:CD35. 下列关于mitmproxy的安装说法错误的是( )下列关于mitmproxy的安装说法错误的是( )A.对于Mac OS系统,使用Homebrew安装mitmproxy,命令为:brew install

10、 mitmproxyB.在Ubuntu中,要安装mitmproxy,首先需要保证系统的Python为Python3.5或者更高版本C.在windows系统中无法使用linux的命令,只能通过下载安装包来安装D.UBUNTU中执行命令 sudo pip3 install mitmproxy 进行安装参考答案:C36. 以下哪个HTML标签表示定义文档的主体( )以下哪个HTML标签表示定义文档的主体( )A.divB.bodyC.headD.footer参考答案:B37. Python中有哪些实现多线程方法?( )A.multiprocess.dummyB.threading.ThreadC.p

11、rocessD.PyMongoDB参考答案:AB38. Python中( )容器有推导式。Python中( )容器有推导式。A.列表B.元组C.字典D.集合参考答案:ACD39. HTTP状态码302表示资源永久重定向。( )T.对F.错参考答案:F40. 使用UI Automatorr输入文字的操作是得到相应控件后使用命令( )使用UI Automatorr输入文字的操作是得到相应控件后使用命令( )A.settextB.setC.set_textD.text参考答案:C41. Charles是一个收费软件,如果没有注册,安装以后的前30天可以正常使用。30天以后,虽然功能不会缩水,但每过3

12、0分钟Charles会自动关闭一次。( )T.对F.错参考答案:T42. 如果目标网站有反爬虫声明,那么对方在被爬虫爬取以后,可以根据( )来起诉使用爬虫的公司。A.服务器日志B.数据库日志记录C.程序日志记录D.服务器监控参考答案:ABCD43. 在请求头中设置User-Agent即可正常请求网站。( )在请求头中设置User-Agent即可正常请求网站。( )A.正确B.错误参考答案:B44. 一个可行的自动更换代理的爬虫系统,应该下列哪些功能?( )A.有一个小爬虫ProxySpider去各大代理网站爬取免费代理并验证,将可以使用的代理IP保存到数据库中B.在发现某个请求已经被设置过代理

13、后,什么也不做,直接返回C.在ProxyMiddlerware的process_request中,每次从数据库里面随机选择一条代理IP地址使用D.周期性验证数据库中的无效代理,及时将其删除参考答案:ACD45. 插入数据时,MongoDB会自动添加一列“_id”,也就是自增ID,每次自动加1。( )T.对F.错参考答案:F46. Redis中列表读取数据命令lrange中l代表left,即从左侧开始读取。( )Redis中列表读取数据命令lrange中l代表left,即从左侧开始读取。( )A.正确B.错误参考答案:B47. 当爬虫创建好了之后,可以使用scrapy( )命令运行爬虫。A.startupB.starwarC.drawlD.crawl参考答案:D48. 以下哪些可以独立成为Python编译器( )以下哪些可以独立成为Python编译器( )A.PycharmB.IDLEC.EclipseD.Visual Studio 2010参考答案:AB49. robots.txt是一种规范,在法律范畴内。( )robots.txt是一种规范,在法律范畴内。(

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号