[南开大学]19秋学期(1709、1803、1809、1903、1909)《网络爬虫与信息提取》在线作业1

上传人:lyj****12 文档编号:99160173 上传时间:2019-09-17 格式:DOC 页数:9 大小:34.50KB
返回 下载 相关 举报
[南开大学]19秋学期(1709、1803、1809、1903、1909)《网络爬虫与信息提取》在线作业1_第1页
第1页 / 共9页
亲,该文档总共9页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《[南开大学]19秋学期(1709、1803、1809、1903、1909)《网络爬虫与信息提取》在线作业1》由会员分享,可在线阅读,更多相关《[南开大学]19秋学期(1709、1803、1809、1903、1909)《网络爬虫与信息提取》在线作业1(9页珍藏版)》请在金锄头文库上搜索。

1、【奥鹏】南开大学19秋学期(1709、1803、1809、1903、1909)网络爬虫与信息提取在线作业试卷总分:100 得分:100第1题,Python中把集合转换为列表需要使用#函数A、setB、listC、convertD、change正确答案:B第2题,下面Python代码输出为():def default_para_without_trap(para=, value=0):if not para:para = para.append(value)return paraprint(第一步:.format(default_para_trap(value=100)print(第二步:.fo

2、rmat(default_para_trap(value=50)A、第一步:100第二步:100,50B、第一步:100第二步:50C、第一步:100第二步:D、第一步:100第二步:100正确答案:B第3题,以下哪个HTML标签表示分区或节()A、B、C、D、正确答案:A第4题,使用xpath方法的返回类型是()A、列表B、元组C、字典D、集合正确答案:A第5题,以下哪个HTML标签表示定义 HTML 表格中的标准单元格()A、B、C、D、正确答案:D第6题,当需要把Python里面的数据发送给网页时,需要先转换成()字符串A、PythonB、JsonC、正则表达式D、Ajax正确答案:B第

3、7题,以下哪个命令是利用URL语法在命令行下工作的文件传输工具()A、curlB、tar -zxvfC、mkdirD、cp正确答案:A第8题,带上通过Chrome浏览器从评论页面复制而来的()再发起请求,可以减少爬虫被网站封锁的概率A、CookieB、HtmlC、HeadersD、CSS正确答案:C第9题,Python正则表达式模块的findall方法提取内容包含多个,则返回结果的列表中会包含()A、列表B、元组C、字典D、集合正确答案:B第10题,PyMongo中逻辑查询表示不等于的符号是()A、$gtB、$ltC、$eq$ne正确答案:C第11题,()是一个传递信息的通道。它负责将爬取博文

4、列表页获取到的信息传递给负责爬取正文页的方法中。A、metaB、headC、headerD、body正确答案:A第12题,使用Xpath构造相同字符串开头的路径采用()方法A、starts-withB、startsC、beginD、begin-with正确答案:A第13题,Python正则表达式模块的findall方法如果没有匹配到结果,则返回结果为()A、空B、空列表C、空元组D、不返回正确答案:B第14题,当需要把Python里面的数据发送给网页时,应先将其转换成()A、Json字符串B、GETC、POSTD、Request正确答案:A第15题,使用UI Automator获滚动屏幕的操作

5、是得到相应控件后使用命令()A、scrollB、scroll_upC、scroll_forwordD、scroll_back正确答案:A第16题,Redis若要进入交互环境,需要打开终端输入()A、redis-cliB、redisC、redis-cmdD、redis-start正确答案:A第17题,使用Xpath获取文本使用()A、textB、text()C、contentD、content()正确答案:B第18题,Python中Object=obj_1:1,obj_2:2,则Objcet是()A、列表B、元组C、字典D、集合正确答案:C第19题,使用UI Automator使屏幕向上滚动一屏

6、的操作是得到相应控件后使用命令()A、scroll_forwadB、scroll_upC、scroll.forwardD、scroll.vert.forward正确答案:D第20题,xpath中extract方法返回值类型是()A、列表B、元组C、字典D、集合正确答案:A第21题,Python中有哪些实现多线程方法()A、multiprocess.dummyB、threading.ThreadC、processD、PyMongoDB正确答案:A,B第22题,HTTP常用状态码表明表明浏览器需要执行某些特殊的处理以正确处理请求的有()A、200B、301C、302D、204正确答案:B,C第23

7、题,Python中的容器有()A、列表B、元组C、字典D、集合正确答案:A,B,C,D第24题,Python中()容器有推导式A、列表B、元组C、字典D、集合正确答案:A,C,D第25题,Python中一个函数可以有()个return语句A、0B、1C、多个D、2正确答案:A,B,C,D第26题,使用BeautifulSoup对象后可以使用()来查找内容A、find_allB、findC、searchD、search_all正确答案:A,B第27题,在配置ios使用Charles的操作中,正确的有()A、对于苹果设备,首先要保证计算机和苹果设备联在同一个Wi-Fi上。B、选择“HTTP代理”下

8、面的“手动”选项卡,在“服务器”处输入计算机的IP地址,在“端口”处输入8888C、输入完成代理以后按下苹果设备的Home键,设置就会自动保存。D、安装完成证书以后,在设置中打开“关于本机”,找到最下面的“证书信任设置”,并在里面启动对Charles证书的完全信任正确答案:A,B,C,D第28题,网络爬虫的用途有()A、收集数据B、尽职调查C、提高流量D、攻击服务器正确答案:A,B,C第29题,HTTP常用状态码表明表明客户端是发生错误的原因所在的有()A、403B、404C、500D、503正确答案:A,B第30题,HTTP常用状态码表明请求被正常处理的有()A、200B、301C、302D

9、、204正确答案:A,D第31题,异步加载的内容一般在网页框架加载完成之前T、对F、错正确答案:F第32题,当使用Scarpy创建爬虫时,当爬取网易云音乐首页信息时,scrapy genspider的第二个参数直接输入就可以了T、对F、错正确答案:F第33题,要实现Charles对Android抓包,其过程比iOS稍微复杂一点。这是因为不同的Andorid设备,安装证书的入口可能不一样T、对F、错正确答案:T第34题,Python可以将列表或字典转换成Json字符串T、对F、错正确答案:T第35题,HTTP状态码302与307完全同义。T、对F、错正确答案:T第36题,Python中元组生成以

10、后还可以往里面继续添加数据,也可以从里面删除数据;T、对F、错正确答案:F第37题,在默认情况下,Scrapyd可以从外网访问T、对F、错正确答案:F第38题,所有的异步加载都会向后台发送请求T、对F、错正确答案:F第39题,在使用多线程处理问题时,线程池设置越大越好T、对F、错正确答案:F第40题,Python中直接对浮点数进行计算有print(0.1+0.2),则结果为0.3T、对F、错正确答案:F第41题,上课传纸条。A要把纸条传给B,但是A与B距离太远,于是让C来转交纸条。此时,C先篡改纸条的内容再传给B,这是一种类似抓包的方式。T、对F、错正确答案:F第42题,requests中ge

11、t请求方法的使用为requests.get(网址, data=data)T、对F、错正确答案:F第43题,Python中写CSV文件的writerows方法参数为字典类型T、对F、错正确答案:F第44题,虽然MongoDB相比于MySQL来说,速度快了很多,但是频繁读写MongoDB还是会严重拖慢程序的执行速度。T、对F、错正确答案:T第45题,Python中条件语句在使用or连接的多个表达式中,只要有一个表达式为真,那么后面的表达式就不会执行。T、对F、错正确答案:T第46题,XPath提取出来的内容是一个SelectorList对象,它的第0个元素就是网页的源代码。T、对F、错正确答案:F第47题,插入数据时,MongoDB会自动添加一列“_id”,也就是自增ID,每次自动加1T、对F、错正确答案:F第48题,爬虫登录需要识别验证码可以先把程序关闭,肉眼识别以后再重新运行T、对F、错正确答案:F第49题,mitmproxy的强大之处在于它还自带一个mitmdump命令。这个命令可以用来运行符合一定规则的Python脚本T、对F、错正确答案:T第50题,已经创建好的Scrapy爬虫*.py文件可以直接通过Python来运行T、对F、错正确答案:F

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号