南开19秋学期(1709、1803、1809、1903、1909)《网络爬虫与信息提取》在线作业满分啦哦

上传人:哼**** 文档编号:105056207 上传时间:2019-10-11 格式:DOC 页数:7 大小:27.50KB
返回 下载 相关 举报
南开19秋学期(1709、1803、1809、1903、1909)《网络爬虫与信息提取》在线作业满分啦哦_第1页
第1页 / 共7页
亲,该文档总共7页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《南开19秋学期(1709、1803、1809、1903、1909)《网络爬虫与信息提取》在线作业满分啦哦》由会员分享,可在线阅读,更多相关《南开19秋学期(1709、1803、1809、1903、1909)《网络爬虫与信息提取》在线作业满分啦哦(7页珍藏版)》请在金锄头文库上搜索。

1、南开19秋学期(1709、1803、1809、1903、1909)网络爬虫与信息提取在线作业-0003试卷总分:100 得分:100一、单选题 (共 20 道试题,共 40 分)1.以下表示请求资源找不到的HTTP状态码为A.500B.404C.301D.200答案:B2.Redis是()数据库A.键值数据库B.图数据库C.列存数据库D.关系数据库答案:A3.服务器端记录信息确定用户身份的数据是A.sessionB.moonpiesC.localstorageD.cookies答案:A4.lxml库中etree模块的()方法把Selector对象转换为bytes型的源代码数据A.etree.t

2、ostringB.etree.toBytesC.etree.convertstringD.etree.convertBytes答案:A5.当需要把Python里面的数据发送给网页时,应先将其转换成()A.RequestB.POSTC.Json字符串D.GET答案:C6.通过()爬取伪装成异步加载的后端渲染数据A.正则表达式B.Json字符串C.JavaScriptD.Get答案:A7.下列说法错误的是()A.用Python来请求小程序的后台接口从而获取数据,比请求异步加载网页的后台接口要复杂很多。B.小程序的请求极其简单,基本上没有验证信息C.小程序的反爬虫能力比网页版的低很多。使用小程序的接

3、口来爬数据,能极大提高爬虫的开发效率。D.如果目标网站有微信小程序,那么一定要优先调查能否通过小程序的接口来抓取数据。答案:A8.Python中定义函数关键字为()A.functionB.funcC.defineD.def答案:D9.requests中post请求方法的使用为requests.post(网址, data=data)中的data为()A.集合B.字典C.列表D.元组答案:B10.Redis中查看一个列表长度,使用关键字()A.llenB.lengthC.lenD.count答案:A11.Python并导入uiautomator来操作设备的语句是from uiautomator i

4、mport ()A.JobsB.JobC.DevicesD.Device答案:D12.HTTP常用状态码表明服务器内部资源出故障了的是()A.503B.500C.404D.403答案:B13.下面代码一共执行循环多少次(): for i in range(10): print(i * i)A.9B.11#0C.10答案:C14.PyMongo中的查找方法的参数是哪种数据结构()A.集合B.字典C.列表D.元组答案:B15.使用UI Automatorr根据坐标来滑动桌面的操作是得到相应控件后使用命令()A.swipeB.scrollC.moveD.fly答案:A16.Python中列表可以用(

5、)方法在末尾添加元素A.plusB.appendC.addD.+答案:B17.Python中跳过本次循环应用关键字()A.returnB.exitC.continueD.break答案:C18.如果计算机上连接了很多台手机,查看这些手机串号,需要在终端输入以下命令:()A.adb devices -listB.adb devices -lC.adb devicesD.adb device答案:B19.Python中若定义object=1, 2, 3, 4, 5,则print(object-4)输出()A.程序报错B.NULLC.4D.2答案:D20.Python中线程池map()方法第二个参数

6、是()A.集合B.字典C.列表D.元组答案:C二、多选题 (共 10 道试题,共 20 分)21.以下哪种方法是MongoDB的查找方法()A.findsB.find_oneC.find_allD.find答案:BD22.下列关于mitmproxy的使用说法正确的是()A.设置好代理以后,在手机上打开一个App或者打开一个网页,可以看到mitmproxy上面有数据滚动。B.用鼠标在终端窗口上单击其中的任意一个请求,可以显示这个数据包的详情信息。C.如果要访问HTTPS网站,还需要安装mitmproxy的证书D.mitmproxy的端口为8080端口。答案:ABCD23.Python中一个函数没

7、有返回值则可以写()A.没有returnB.return NoneC.return NULLD.return答案:ABD24.下列说法错误的是()A.如果返回的是JSON类型的字符串,python无法进行解析。B.命令行中执行mitmdump -s parse_request.py即可运行python 脚本C.使用python可以自定义返回的数据包,如 response.headers,就是返回的头部信息D.mitmproxy的强大之处在于它还自带一个mitmdump命令。这个命令可以用来运行符合一定规则的Python脚本,并在Python脚本里面直接操作HTTP和HTTPS的请求,以及返回的

8、数据包。答案:BCD25.Python中一个函数可以有()个return语句A.多个B.2C.1D.0答案:ABCD26.一个可行的自动更换代理的爬虫系统,应该下列哪些功能?A.有一个小爬虫ProxySpider去各大代理网站爬取免费代理并验证,将可以使用的代理IP保存到数据库中B.在发现某个请求已经被设置过代理后,什么也不做,直接返回C.在ProxyMiddlerware的process_request中,每次从数据库里面随机选择一条代理IP地址使用D.周期性验证数据库中的无效代理,及时将其删除答案:ACD27.为了解决爬虫代码本身的错误引起的异常,可以采用下列哪些方法A.等待B.开发爬虫中

9、间件C.开发下载器中间件D.仔细检查代码答案:BD28.以下HTTP状态码表示服务器本身发生错误的是A.503B.500C.400D.302答案:AB29.PyMongo更新操作有()A.update_oneB.update_manyC.update_allD.update答案:AB30.以下HTTP状态码表示服务器没有正常返回结果的是A.500B.404C.301D.200答案:ABC三、判断题 (共 20 道试题,共 40 分)31.Cookies一般包含在请求头Headers中答案:正确32.MongoDB URI的格式为: mongodb:/服务器IP或域名:端口用户名:密码答案:错误

10、33.RoboMongo是MongoDB的管理软件答案:正确34.上课传纸条中,传递纸条的人就可以发起中间人攻击。答案:正确售后或需要更多联系QQ1192235545 微信同步 35.网站返回的Headers中经常有Cookies,可以用mitmdump脚本使用print函数把Cookies打印出来。答案:错误36.Python中写CSV文件的writerow方法参数为包含字典的列表类型答案:错误37.Charles能截获HTTP和HTTPS的数据包,如果网站使用websocket就可以截获。答案:错误38.Python中相比于findall方法,search方法对于从超级大的文本里面只找第1

11、个数据特别有用,可以大大提高程序的运行效率。答案:正确39.使用Nginx反向代理到Scrapyd以后,Scrapyd本身只需要开通内网访问即可,不许经过输入密码答案:正确40.在Ubuntu下若要运行Redis可以使用CMD进入解压以后的文件夹并运行命令redis-server.exe redis.windows.conf启动Redis答案:错误41.爬虫登录需要识别验证码可以先把程序关闭,肉眼识别以后再重新运行答案:错误42.process_spider_input(response, spider)是在爬虫运行yield item或者yield scrapy.Request()的时候调用

12、答案:错误43.通用搜索引擎的目标是尽可能大的网络覆盖率,搜索引擎服务器资源与网络数据资源互相匹配答案:错误44.异步加载的内容一般在网页框架加载完成之前答案:错误45.Redis中列表读取数据命令lrange中l代表left,即从左侧开始读取答案:错误46.Selenium必须加载对应的webdriver才能模拟浏览器访问答案:正确47.当运行爬虫代码后,出现Forbidden by robots.txt提示后,说明当前时间段被爬取的网站无法访问。答案:错误48.Redis是遵守BSD协议、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库答案:正确49.Python中包含字典的列表页可以转换成JSON字符串答案:正确50.PyMongoDB中排序方法sort第二个参数-1表示升序答案:错误

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 资格认证/考试 > 成考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号