《Python学习课件---053论一只爬虫的自我修养》由会员分享,可在线阅读,更多相关《Python学习课件---053论一只爬虫的自我修养(5页珍藏版)》请在金锄头文库上搜索。
零基础入门学习Python 作者:小甲鱼 让编程改变世界 Change the world by program 论一只爬虫的自我修养 论一只爬虫的自我修养 Python如何访问互联网? 论一只爬虫的自我修养 UR L lib urllib 论一只爬虫的自我修养 URL的一般格式为(带方括号的为可选项): protocol :/ hostname:port / path / ;parameters?query#fragment URL由三部分组成: 第一部分是协议:http,https,ftp,file,ed2k 第二部分是存放资源的服务器的域名系统或IP地址(有 时候要包含端口号,各种传输协议都有默认的端口号 ,如http的默认端口为80)。 第三部分是资源的具体地址,如目录或文件名等。