[南开大学]19秋学期(1709、1803、1809、1903、1909)《网络爬虫与信息提取》在线作业

上传人:lyj****12 文档编号:99147218 上传时间:2019-09-17 格式:DOC 页数:9 大小:34.50KB
返回 下载 相关 举报
[南开大学]19秋学期(1709、1803、1809、1903、1909)《网络爬虫与信息提取》在线作业_第1页
第1页 / 共9页
亲,该文档总共9页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《[南开大学]19秋学期(1709、1803、1809、1903、1909)《网络爬虫与信息提取》在线作业》由会员分享,可在线阅读,更多相关《[南开大学]19秋学期(1709、1803、1809、1903、1909)《网络爬虫与信息提取》在线作业(9页珍藏版)》请在金锄头文库上搜索。

1、【奥鹏】南开大学19秋学期(1709、1803、1809、1903、1909)网络爬虫与信息提取在线作业试卷总分:100 得分:100第1题,启动MongoDB使用命令mongod -() usr/local/etc/mongod.confA、configB、installC、startD、begin正确答案:A第2题,下列哪项不是HTTP的请求类型()A、GETB、POSTC、PUTD、SET正确答案:D第3题,以下哪个命令是利用URL语法在命令行下工作的文件传输工具()A、curlB、tar -zxvfC、mkdirD、cp正确答案:A第4题,HTTP常用状态码表明服务器内部资源出故障了的

2、是()A、500B、503C、403D、404正确答案:A第5题,windows中创建定时任务的命令为A、taskB、schtasksC、createtasksD、maketasks正确答案:B第6题,Python中若定义object=(1, 2, 3, 4, 5),则print(object:3)输出()A、345B、34C、45D、123正确答案:C第7题,打开终端,输入(),屏幕上会出现Python的路径A、python pathB、path pythonC、which pythonD、python which正确答案:C第8题,在Scrapy的目录下,哪个文件负责数据抓取以后的处理工作

3、?()A、spiders文件夹B、item.pyC、pipeline.pyD、settings.py正确答案:C第9题,下面Python代码输出为():def default_para_trap(para=, value=0):para.append(value)return paraprint(第一步:.format(default_para_trap(value=100)print(第二步:.format(default_para_trap(value=50)A、第一步:100第二步:100,50B、第一步:100第二步:50C、第一步:100第二步:D、第一步:100第二步:100正确答

4、案:A第10题,以下哪个HTML标签表示定义 HTML 表格中的标准单元格()A、B、C、D、正确答案:D第11题,使用Xpath构造属性值包含相同字符串的路径采用()方法A、containB、containsC、includeD、includes正确答案:B第12题,以下表示请求正常处理的HTTP状态码为A、200B、301C、404D、500正确答案:A第13题,Scrapy_redis是Scrapy的“()”,它已经封装了使用Scrapy操作Redis的各个方法A、组件B、模块C、控件D、单元正确答案:A第14题,HTTP状态码401表示A、请求报文中可能存在语法错误B、请求需要通过HT

5、TP认证C、请求资源的访问被拒绝D、服务器上没有请求的资源正确答案:B第15题,使用UI Automatorr判断元素是否存在的操作是得到相应控件后使用命令()A、existB、existsC、isnullD、contains正确答案:B第16题,如果使用Python的数据结构来做类比的话,MongoDB中库相当于一个()A、列表B、元组C、字典D、集合正确答案:C第17题,Python中以下哪个容器里的元素不能重复()A、列表B、元组C、字典D、集合正确答案:D第18题,Python正则表达式模块的findall方法返回结果为()A、列表B、元组C、字典D、集合正确答案:A第19题,使用UI

6、 Automator获取屏幕上显示的文本内容的操作是得到相应控件后使用命令()A、contentB、textC、titleD、body正确答案:B第20题,以下表示请求资源重定向的HTTP状态码为A、200B、301C、404D、500正确答案:B第21题,常用的会话跟踪技术是A、sessionB、cookiesC、moonpiesD、localstorage正确答案:A,B第22题,如果目标网站有反爬虫声明,那么对方在被爬虫爬取以后,可以根据()来起诉使用爬虫的公司A、服务器日志B、数据库日志记录C、程序日志记录D、服务器监控正确答案:A,B,C,D第23题,PyMongo删除操作有()A、

7、deleteB、delete_allC、delete_oneD、delete_many正确答案:C,D第24题,以下哪些方法属于Python写CSV文件的方法()A、writeheadersB、writeheaderC、writerrowsD、writerow正确答案:A,C,D第25题,使用Selennium获取网页中元素的方法有A、find_element_by_nameB、find_element_by_idC、find_elements_by_nameD、find_elements_by_id正确答案:A,B,C,D第26题,在配置ios使用Charles的操作中,正确的有()A、对于

8、苹果设备,首先要保证计算机和苹果设备联在同一个Wi-Fi上。B、选择“HTTP代理”下面的“手动”选项卡,在“服务器”处输入计算机的IP地址,在“端口”处输入8888C、输入完成代理以后按下苹果设备的Home键,设置就会自动保存。D、安装完成证书以后,在设置中打开“关于本机”,找到最下面的“证书信任设置”,并在里面启动对Charles证书的完全信任正确答案:A,B,C,D第27题,cookies的缺点是A、实现自动登录B、跟踪用户状态C、http中明文传输D、增加http请求的流量正确答案:C,D第28题,Python中()容器有推导式A、列表B、元组C、字典D、集合正确答案:A,C,D第29

9、题,一个可行的自动更换代理的爬虫系统,应该下列哪些功能?A、有一个小爬虫ProxySpider去各大代理网站爬取免费代理并验证,将可以使用的代理IP保存到数据库中B、在发现某个请求已经被设置过代理后,什么也不做,直接返回C、在ProxyMiddlerware的process_request中,每次从数据库里面随机选择一条代理IP地址使用D、周期性验证数据库中的无效代理,及时将其删除正确答案:A,C,D第30题,Python中通过Key来从字典object中读取对应的Value的方法有()A、objectkeyB、object.get(key)C、object.pop(key)D、object.

10、pop()正确答案:A,B第31题,XPath提取出来的内容是一个SelectorList对象,它的第0个元素就是网页的源代码。T、对F、错正确答案:F第32题,在对XPath返回的对象再次执行XPath的时候,子XPath开头需要添加斜线T、对F、错正确答案:F第33题,robots.txt是一种规范,在法律范畴内T、对F、错正确答案:F第34题,PyMongoDB中排序方法sort第二个参数1表示降序T、对F、错正确答案:F第35题,在使用多线程处理问题时,线程池设置越大越好T、对F、错正确答案:F第36题,requests中post请求方法的使用为requests.post(网址, da

11、ta=data)T、对F、错正确答案:T第37题,在MacOS下若要运行Redis可以运行解压以后的文件夹下面的src文件夹中的redis-server文件启动redis服务src/redis-serverT、对F、错正确答案:F第38题,device.sleep()方法是使用UI Automatorr关闭屏幕的命令T、对F、错正确答案:T第39题,通用网络爬虫通常采用串行工作方式T、对F、错正确答案:F第40题,如果把网络上发送与接收的数据包理解为快递包裹,那么在快递运输的过程中取出查看更改里面的内容,就是类似抓包的过程T、对F、错正确答案:F第41题,在Windows中下若要运行Redis

12、可以运行redis-server /usr/local/etc/redis.confT、对F、错正确答案:F第42题,使用AJAX技术,可以在不刷新网页的情况下更新网页数据T、对F、错正确答案:T第43题,当Charles抓包以后,在Mac OS系统下可以按Command+F组合键,在Windows系统下按Ctrl+F组合键打开Charles进行搜索T、对F、错正确答案:T第44题,如果MongoDB运行在所在的计算机上,MONGODB_HOST应该写成192.168.0.1T、对F、错正确答案:F第45题,Scrapyd可以同时管理多个Scrapy工程里面的多个爬虫的多个版本T、对F、错正确答案:T第46题,在Linux的终端使用apt-get命令安装一系列依赖库时,其中如果存在有已经安装的库,会覆盖掉之前的库重新安装T、对F、错正确答案:F第47题,Python正则表达式中“.*”是贪婪模式,获取最长的满足条件的字符串。T、对F、错正确答案:T第48题,Python中条件语句在使用and连接的多个表达式中,只要有一个表达式不为真,那么后面的表达式就不会执行。T、对F、错正确答案:T第49题,PyMongoDB中排序方法sort第二个参数-1表示升序T、对F、错正确答案:F第50题,一般来说在页面都通过GET将用户登录信息传递到服务器端。T、对F、错正确答案:F

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号