南开20春学期(1709、1803、1809、1903、1909、2003)《网络爬虫与信息提取》在线作业答案

上传人:you7****5932 文档编号:137564971 上传时间:2020-07-09 格式:DOCX 页数:10 大小:14.54KB
返回 下载 相关 举报
南开20春学期(1709、1803、1809、1903、1909、2003)《网络爬虫与信息提取》在线作业答案_第1页
第1页 / 共10页
南开20春学期(1709、1803、1809、1903、1909、2003)《网络爬虫与信息提取》在线作业答案_第2页
第2页 / 共10页
亲,该文档总共10页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《南开20春学期(1709、1803、1809、1903、1909、2003)《网络爬虫与信息提取》在线作业答案》由会员分享,可在线阅读,更多相关《南开20春学期(1709、1803、1809、1903、1909、2003)《网络爬虫与信息提取》在线作业答案(10页珍藏版)》请在金锄头文库上搜索。

1、20春学期(1709、1803、1809、1903、1909、2003)网络爬虫与信息提取在线作业试卷总分:100 得分:98一、单选题 (共 20 道试题,共 40 分)1.Python正则表达式模块的findall方法提取内容包含多个,则返回结果的列表中会包含()A.列表B.元组C.字典D.集合答案:B2.以下表示请求正常处理的HTTP状态码为A.200B.301C.404D.500答案:A3.Python中线程池map()方法第二个参数是()A.列表B.元组C.字典D.集合答案:A4.()是一个传递信息的通道。它负责将爬取博文列表页获取到的信息传递给负责爬取正文页的方法中。A.metaB

2、.headC.headerD.body答案:A5.如果使用Python的数据结构来做类比的话,MongoDB中集合相当于一个()A.列表B.元组C.字典D.集合答案:A6.PyMongo中逻辑查询表示不等于的符号是()A.$neB.$ltC.$gtD.$eq答案:7.PyMongo中逻辑查询表示大于等于的符号是()A.$gtB.$ltC.$gteD.$lte答案:C8.以下哪个HTML标签表示定义文档的主体()A.B.C.D.答案:B9.某些网站在发起Ajax请求时会携带()字符串用于身份验证A.TokenB.CookieC.ReqTimeD.sum答案:A10.下面Python代码输出为()

3、: def default_para_trap(para=, value=0): para.append(value) return para print(第一步:.format(default_para_trap(value=100) print(第二步:.format(default_para_trap(value=50)A.第一步:100 第二步:100,50B.第一步:100 第二步:50C.第一步:100 第二步:D.第一步:100 第二步:100答案:A11.用Xpathh获取第二个div标签应该是()A.dvi(1)B.div(2)C.div1D.div2答案:D12.查看网站请

4、求一般在Chrome开发者模式下的()选项卡中查看A.ConsoleB.SourcesC.NetworkD.Performance答案:C13.Python中Object=obj_1:1,obj_2:2,则Objcet.get(boj_1,3)是()A.1B.2C.3D.无输出答案:A14.通常使用()工具来模拟浏览器进行爬虫请求A.SeleniumB.ChromeC.ChromeDriverD.WebDriver答案:A15.Python并导入uiautomator来操作设备的语句是from uiautomator import ()A.DeviceB.DevicesC.JobsD.Job答

5、案:A16.Python中把列表转换为集合需要使用#函数A.setB.listC.convertD.change答案:A17.Python中若定义object=12345,则print(object:-1)输出()A.1B.5C.54321D.程序报错答案:C18.Python正则表达式模块的findall方法如果没有匹配到结果,则返回结果为()A.空B.空列表C.空元组D.不返回答案:B19.以下哪个命令是利用URL语法在命令行下工作的文件传输工具()A.curlB.tar -zxvfC.mkdirD.cp答案:A20.使用UI Automatorr输入文字的操作是得到相应控件后使用命令()

6、A.settextB.setC.set_textD.text答案:C二、多选题 (共 10 道试题,共 20 分)21.HTTP常用状态码表明表明客户端是发生错误的原因所在的有()A.403B.404C.500D.503答案:AB22.Python中()容器有推导式A.列表B.元组C.字典D.集合答案:ACD23.Python中通过Key来从字典object中读取对应的Value的方法有()A.objectkeyB.object.get(key)C.object.pop(key)D.object.pop()答案:AB24.PyMongo更新操作有()A.updateB.update_allC.

7、update_oneD.update_many答案:CD25.HTTP常用状态码表明表明服务器本身发生错误的有()A.403B.404C.500D.503答案:CD26.以下哪些可以独立成为Python编译器()A.PycharmB.IDLEC.EclipseD.Visual Studio 2010答案:AB27.requests中post请求方法的第二个参数可以为()A.字典B.列表C.json数据D.字符串答案:AC28.MongoDB中获取名字为set1的集合的语句为()A.database.set1B.database(set1)C.databaseset1D.databaseset1

8、答案:AC29.最常见的HTTP请求类型有()A.GETB.POSTC.SENDD.RECEIVE答案:AB30.PyMongo删除操作有()A.deleteB.delete_allC.delete_oneD.delete_many答案:CD三、判断题 (共 20 道试题,共 40 分)31.在请求头中设置User-Agent即可正常请求网站答案:错误32.一般来说在页面都通过GET将用户登录信息传递到服务器端。答案:错误33.Scrapy作为一个爬虫的框架,它在单机环境下运行时就可以获得最大性能优势答案:错误34.当运行爬虫代码后,出现Forbidden by robots.txt提示后,说

9、明当前时间段被爬取的网站无法访问。答案:错误35.使用UI Automatorr操作实体键的命令为device.press.实体按键名称()答案:正确36.爬虫中间件的作用对象是请求request和返回response答案:错误37.Redis中列表读取数据命令lrange中l代表left,即从左侧开始读取答案:错误38.运行MongoDB以后,不会在终端打印任何Log答案:错误39.Selenium必须加载对应的webdriver才能模拟浏览器访问答案:正确40.Robo 3T与RoboMongo是完全不一样的软件答案:错误41.在中间人攻击中,攻击者可以拦截通信双方的通话,并插入新的内容或

10、者修改原有内容答案:正确42.使用Charles,可以轻松截获手机App和微信小程序的数据包,从而开发出直接抓取App后台和小程序后台的爬虫。答案:正确43.要实现Charles对Android抓包,其过程比iOS稍微复杂一点。这是因为不同的Andorid设备,安装证书的入口可能不一样答案:正确44.Python中包含字典的列表页可以转换成JSON字符串答案:正确45.MongoDB URI的格式为: mongodb:/服务器IP或域名:端口用户名:密码答案:错误46.Python中字符串切片以后的结果还是字符串答案:正确47.微信小程序的反爬虫能力要比网页的高很多。答案:错误48.cookies在http请求中是明文传输的。答案:正确49.默认情况下,MongoDB可以通过外网访问答案:错误50.Python中列表生成以后还可以往里面继续添加数据,也可以从里面删除数据;答案:正确

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号