南开大学21春《网络爬虫与信息提取》在线作业一满分答案17

资源描述

《南开大学21春《网络爬虫与信息提取》在线作业一满分答案17》由会员分享，可在线阅读，更多相关《南开大学21春《网络爬虫与信息提取》在线作业一满分答案17（14页珍藏版）》请在金锄头文库上搜索。

1、南开大学21春网络爬虫与信息提取在线作业一满分答案1. lxml库中etree模块的( )方法把Selector对象转换为bytes型的源代码数据。A.etree.tostringB.etree.convertBytesC.etree.toBytesD.etree.convertstring参考答案：A2. Scrapy_redis是Scrapy的“( )”，它已经封装了使用Scrapy操作Redis的各个方法。Scrapy_redis是Scrapy的“( )”，它已经封装了使用Scrapy操作Redis的各个方法。A.组件B.模块C.控件D.单元参考答案：A3. HTTP常用状态码表明表明客

2、户端是发生错误的原因所在的有( )。A.403B.404C.500D.503参考答案：AB4. 插入数据时，MongoDB会自动添加一列“_id”，也就是自增ID，每次自动加1。( )T.对F.错参考答案：F5. Redis插入数据都是插入到列表右侧，因此读取数据也是从右侧读取。( )A.正确B.错误参考答案：B6. 使用异步加载技术的网站，被加载的内容可以在源代码中找到。( )T.对F.错参考答案：F7. HTTP状态码503表示服务器内部故障。( )T.对F.错参考答案：F8. requests中post请求方法的第二个参数可以为( )requests中post请求方法的第二个参数可以为(

3、 )A.字典B.列表C.json数据D.字符串参考答案：AC9. Python中Object=&39;obj_1&39;:&39;1&39;,&39;obj_2&39;:&39;2&39;，则Objcet.get(&39;boj_1&39;,&39;3&39;)是( )Python中Object=obj_1:1,obj_2:2，则Objcet.get(boj_1,3)是( )A.1B.2C.3D.无输出参考答案：A10. 如果爬虫爬取的是商业网站，并且目标网站使用了反爬虫机制，那么强行突破反爬虫机制可能构成( )。A.非法侵入计算机系统罪B.非法获取计算机信息系统数据罪C.非法获取计算机数据罪

4、D.非法获取系统罪参考答案：AB11. Redis中往集合中读数据，使用关键字( )A.popB.spopC.lpopD.range参考答案：B12. 为了保证数据插入效率，在内存允许的情况下，应该一次性把数据读入内存，尽量减少对MongoDB的读取操作。( )T.对F.错参考答案：T13. 虽然MongoDB相比于MySQL来说，速度快了很多，但是频繁读写MongoDB还是会严重拖慢程序的执行速度。( )A.正确B.错误参考答案：A14. 用Xpathh获取第二个div标签应该是( )用Xpathh获取第二个div标签应该是( )A.dvi(1)B.div(2)C.div1D.div2参考答

5、案：D15. PyMongo中逻辑查询表示大于的符号是( )PyMongo中逻辑查询表示大于的符号是( )A.$gtB.$ltC.$gte$lte参考答案：A16. Python中列表生成以后还可以往里面继续添加数据，也可以从里面删除数据。( )T.对F.错参考答案：T17. HTTP常用状态码表明服务器上没有请求的资源的是( )A.500B.503C.403D.404参考答案：D18. Python正则表达式模块的findall方法提取内容包含多个，则返回结果的列表中会包含( )A.列表B.元组C.字典D.集合参考答案：B19. 要实现Charles对Android抓包，其过程比iOS稍微复

6、杂一点。这是因为不同的Andorid设备，安装证书的入口可能不一样。( )要实现Charles对Android抓包，其过程比iOS稍微复杂一点。这是因为不同的Andorid设备，安装证书的入口可能不一样。( )A.正确B.错误参考答案：A20. PyMongo中逻辑查询表示不等于的符号是( )。A.$neB.$ltC.$gtD.$eq参考答案：A21. 下列关于mitmproxy的安装说法错误的是( )A.对于Mac OS系统，使用Homebrew安装mitmproxy，命令为：brew install mitmproxyB.在Ubuntu中，要安装mitmproxy，首先需要保证系统的Pyt

7、hon为Python3.5或者更高版本C.在windows系统中无法使用linux的命令，只能通过下载安装包来安装D.UBUNTU中执行命令 sudo pip3 installmitmproxy 进行安装参考答案：C22. 通常使用( )工具来模拟浏览器进行爬虫请求通常使用( )工具来模拟浏览器进行爬虫请求A.SeleniumB.ChromeC.ChromeDriverD.WebDriver参考答案：A23. Redis若要进入交互环境，需要打开终端输入( )Redis若要进入交互环境，需要打开终端输入( )A.redis-cliB.redisC.redis-D.redis-start参考答案

8、：A24. Python中字符串切片以后的结果还是字符串。( )Python中字符串切片以后的结果还是字符串。( )A.正确B.错误参考答案：A25. 网络爬虫的用途有( )。A.收集数据B.尽职调查C.提高流量D.攻击服务器参考答案：ABC26. Python中列表可以用( )方法在末尾添加元素。A.addB.appendC.plusD.+参考答案：B27. BS4可以用来从( )中提取数据A.HTMLB.XMLC.数据库D.JSON参考答案：AB28. requests中post请求方法的使用为requests.post(网址， data=data)中的data为( )。A.列表B.元组C

9、.字典D.集合参考答案：C29. PyMongo中逻辑查询表示不等于的符号是( )PyMongo中逻辑查询表示不等于的符号是( )A.$gtB.$ltC.$eqD.$ne参考答案：C30. PyMongo中逻辑查询表示小于的符号是( )A.$gtB.$ltC.$gte$lte参考答案：B31. MongoDB URI的格式为：mongodb:/服务器IP或域名:端口用户名:密码。( )MongoDB URI的格式为：mongodb:/服务器IP或域名:端口用户名:密码。( )A.正确B.错误参考答案：B32. 网站返回的Headers中经常有Cookies，可以用mitmdump脚本使用pri

10、nt函数把Cookies打印出来。( )网站返回的Headers中经常有Cookies，可以用mitmdump脚本使用print函数把Cookies打印出来。( )A.正确B.错误参考答案：B33. charles配置中，安装完成证书以后，在设置中打开“关于本机”，找到最下面的“证书信任设置”，并在里面启动对Charles证书的完全信任。( )charles配置中，安装完成证书以后，在设置中打开“关于本机”，找到最下面的“证书信任设置”，并在里面启动对Charles证书的完全信任。( )A.正确B.错误参考答案：A34. 以下表示请求正常处理的HTTP状态码为( )以下表示请求正常处理的HTT

11、P状态码为( )A.200B.301C.404D.500参考答案：A35. 使用UI Automator使屏幕向上滚动一屏的操作是得到相应控件后使用命令scroll.vert.forward。( )A.正确B.错误参考答案：B36. 在中间人攻击中，攻击者可以拦截通信双方的通话，并插入新的内容或者修改原有内容。( )在中间人攻击中，攻击者可以拦截通信双方的通话，并插入新的内容或者修改原有内容。( )A.正确B.错误参考答案：A37. 如果把网络上发送与接收的数据包理解为快递包裹，那么在快递运输的过程中取出查看更改里面的内容，就是类似抓包的过程。( )T.对F.错参考答案：F38. 以下表示请求

12、资源找不到的HTTP状态码为( )以下表示请求资源找不到的HTTP状态码为( )A.200B.301C.404D.500参考答案：C39. PyMongoDB中排序方法sort第二个参数1表示降序。( )T.对F.错参考答案：F40. 当运行爬虫代码后，出现“Forbidden by robots.txt”提示后，说明当前时间段被爬取的网站无法访问。( )当运行爬虫代码后，出现“Forbidden by robots.txt”提示后，说明当前时间段被爬取的网站无法访问。( )A.正确B.错误参考答案：B41. Scrapyd可以同时管理多个Scrapy工程里面的多个爬虫的多个版本。( )T.对

13、F.错参考答案：T42. 当使用Scarpy创建爬虫时，当爬取网易云音乐首页信息时，scrapy genspider的第二个参数直接输入就可以了。( )T.对F.错参考答案：F43. Robo 3T与RoboMongo是完全不一样的软件。( )Robo 3T与RoboMongo是完全不一样的软件。( )A.正确B.错误参考答案：B44. 服务器端记录信息确定用户身份的数据是( )。A.sessionB.cookiesC.moonpiesD.localstorage参考答案：A45. ( )是Scrapy官方开发的，用来部署、运行和管理Scrapy爬虫的工具。( )是Scrapy官方开发的，用来部署、运行和管理Scrapy爬虫的工具。A.ScrapydB.ScrapyDeployC.DeployD.Scrapy_Deploy参考答案：A46. robots.txt是一种规范，在法律范畴内。( )A.正确B.错误参考答案：B47. 在Linux的终端使用apt-get命令安装一系列依赖库时，其中如果存在有已经安装的库，会覆盖掉之前的库重新安装。( )A.正确B.错误参考答案：B48. Python中把集合转换

展开阅读全文

南开大学21春《网络爬虫与信息提取》在线作业一满分答案17

最新文档