南开19秋学期(1709、1803、1809、1903、1909)《网络爬虫与信息提取》在线作业(标准答案) (2)

上传人:哼**** 文档编号:115973656 上传时间:2019-11-15 格式:DOC 页数:7 大小:27.50KB
返回 下载 相关 举报
南开19秋学期(1709、1803、1809、1903、1909)《网络爬虫与信息提取》在线作业(标准答案) (2)_第1页
第1页 / 共7页
亲,该文档总共7页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《南开19秋学期(1709、1803、1809、1903、1909)《网络爬虫与信息提取》在线作业(标准答案) (2)》由会员分享,可在线阅读,更多相关《南开19秋学期(1709、1803、1809、1903、1909)《网络爬虫与信息提取》在线作业(标准答案) (2)(7页珍藏版)》请在金锄头文库上搜索。

1、19秋学期(1709、1803、1809、1903、1909)网络爬虫与信息提取在线作业-0002试卷总分:100 得分:100一、单选题 (共 20 道试题,共 40 分)1.Python中把集合转换为列表需要使用#函数A.setB.listC.convertD.change答案:B2.下面Python代码输出为(): def default_para_without_trap(para=, value=0): if not para: para = para.append(value) return para print(第一步:.format(default_para_trap(valu

2、e=100) print(第二步:.format(default_para_trap(value=50)A.第一步:100 第二步:50B.第一步:100 第二步:100,50C.第一步:100 第二步:100D.第一步:100 第二步:答案:A3.以下哪个HTML标签表示分区或节()A.B.C.D.答案:A4.使用xpath方法的返回类型是()A.集合B.字典C.列表D.元组答案:C5.以下哪个HTML标签表示定义 HTML 表格中的标准单元格()A.B.C.D.答案:D6.当需要把Python里面的数据发送给网页时,需要先转换成()字符串A.正则表达式B.PythonC.JsonD.Aja

3、x答案:C7.以下哪个命令是利用URL语法在命令行下工作的文件传输工具()A.tar -zxvfB.mkdirC.curlD.cp答案:C8.带上通过Chrome浏览器从评论页面复制而来的()再发起请求,可以减少爬虫被网站封锁的概率A.HtmlB.HeadersC.CookieD.CSS答案:B9.Python正则表达式模块的findall方法提取内容包含多个,则返回结果的列表中会包含()A.集合B.字典C.列表D.元组答案:D10.PyMongo中逻辑查询表示不等于的符号是()A.$ltB.$gtC.$eq$ne答案:C11.()是一个传递信息的通道。它负责将爬取博文列表页获取到的信息传递给

4、负责爬取正文页的方法中。A.metaB.headerC.headD.body答案:A12.使用Xpath构造相同字符串开头的路径采用()方法A.starts-withB.startsC.begin-withD.begin答案:A13.Python正则表达式模块的findall方法如果没有匹配到结果,则返回结果为()A.空列表B.空元组C.空D.不返回答案:A14.当需要把Python里面的数据发送给网页时,应先将其转换成()A.RequestB.POSTC.Json字符串D.GET答案:C15.使用UI Automator获滚动屏幕的操作是得到相应控件后使用命令()A.scroll_upB.s

5、croll_forwordC.scroll_backD.scroll答案:D16.Redis若要进入交互环境,需要打开终端输入()A.redis-startB.redis-cmdC.redis-cliD.redis答案:C17.使用Xpath获取文本使用()A.text()B.textC.content()D.content答案:A18.Python中Object=obj_1:1,obj_2:2,则Objcet是()A.集合B.字典C.列表D.元组答案:B19.使用UI Automator使屏幕向上滚动一屏的操作是得到相应控件后使用命令()A.scroll.vert.forwardB.scro

6、ll_upC.scroll.forwardD.scroll_forwad答案:A20.xpath中extract方法返回值类型是()A.集合B.字典C.列表D.元组答案:C二、多选题 (共 10 道试题,共 20 分)21.Python中有哪些实现多线程方法()A.threading.ThreadB.processC.multiprocess.dummyD.PyMongoDB答案:AC22.HTTP常用状态码表明表明浏览器需要执行某些特殊的处理以正确处理请求的有()A.302B.301C.204D.200答案:AB23.Python中的容器有()A.集合B.字典C.列表D.元组答案:ABCD2

7、4.Python中()容器有推导式A.集合B.字典C.列表D.元组答案:ABC25.Python中一个函数可以有()个return语句A.多个B.2C.1D.0答案:ABCD26.使用BeautifulSoup对象后可以使用()来查找内容A.search_allB.searchC.find_allD.find答案:CD27.在配置ios使用Charles的操作中,正确的有()A.选择“HTTP代理”下面的“手动”选项卡,在“服务器”处输入计算机的IP地址,在“端口”处输入8888B.输入完成代理以后按下苹果设备的Home键,设置就会自动保存。C.对于苹果设备,首先要保证计算机和苹果设备联在同一

8、个Wi-Fi上。D.安装完成证书以后,在设置中打开“关于本机”,找到最下面的“证书信任设置”,并在里面启动对Charles证书的完全信任答案:ABCD28.网络爬虫的用途有()A.攻击服务器B.收集数据C.提高流量D.尽职调查答案:BCD29.HTTP常用状态码表明表明客户端是发生错误的原因所在的有()A.503B.500C.404D.403答案:CD30.HTTP常用状态码表明请求被正常处理的有()A.302B.301C.204D.200答案:CD三、判断题 (共 20 道试题,共 40 分)31.异步加载的内容一般在网页框架加载完成之前答案:错误32.当使用Scarpy创建爬虫时,当爬取网

9、易云音乐首页信息时,scrapy genspider的第二个参数直接输入就可以了答案:错误33.要实现Charles对Android抓包,其过程比iOS稍微复杂一点。这是因为不同的Andorid设备,安装证书的入口可能不一样答案:正确34.Python可以将列表或字典转换成Json字符串答案:正确35.HTTP状态码302与307完全同义。答案:正确36.Python中元组生成以后还可以往里面继续添加数据,也可以从里面删除数据;答案:错误37.在默认情况下,Scrapyd可以从外网访问答案:错误38.所有的异步加载都会向后台发送请求答案:错误39.在使用多线程处理问题时,线程池设置越大越好答案

10、:错误40.Python中直接对浮点数进行计算有print(0.1+0.2),则结果为0.3答案:错误注意:答案的顺序有可能和你的题不一样 注意核对答案与选项售后或需要更多联系QQ1192235545 微信同步 41.上课传纸条。A要把纸条传给B,但是A与B距离太远,于是让C来转交纸条。此时,C先篡改纸条的内容再传给B,这是一种类似抓包的方式。答案:错误42.requests中get请求方法的使用为requests.get(网址, data=data)答案:错误43.Python中写CSV文件的writerows方法参数为字典类型答案:错误44.虽然MongoDB相比于MySQL来说,速度快了

11、很多,但是频繁读写MongoDB还是会严重拖慢程序的执行速度。答案:正确45.Python中条件语句在使用or连接的多个表达式中,只要有一个表达式为真,那么后面的表达式就不会执行。答案:正确46.XPath提取出来的内容是一个SelectorList对象,它的第0个元素就是网页的源代码。答案:错误47.插入数据时,MongoDB会自动添加一列“_id”,也就是自增ID,每次自动加1答案:错误48.爬虫登录需要识别验证码可以先把程序关闭,肉眼识别以后再重新运行答案:错误49.mitmproxy的强大之处在于它还自带一个mitmdump命令。这个命令可以用来运行符合一定规则的Python脚本答案:正确50.已经创建好的Scrapy爬虫*.py文件可以直接通过Python来运行答案:错误

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 资格认证/考试 > 成考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号