C语言编写网络爬虫good

上传人:人*** 文档编号:561834495 上传时间:2022-09-06 格式:DOC 页数:2 大小:14.50KB
返回 下载 相关 举报
C语言编写网络爬虫good_第1页
第1页 / 共2页
C语言编写网络爬虫good_第2页
第2页 / 共2页
亲,该文档总共2页,全部预览完了,如果喜欢就下载吧!
资源描述

《C语言编写网络爬虫good》由会员分享,可在线阅读,更多相关《C语言编写网络爬虫good(2页珍藏版)》请在金锄头文库上搜索。

1、文档供参考,可复制、编制,期待您的好评与关注! C语言编写网络爬虫#include #include #include #pragma comment(lib, ws2_32.lib) void geturl(char *url) WSADATA WSAData=0; SOCKET sockfd; struct sockaddr_in addr; struct hostent *pURL; char myurlBUFSIZ; char *pHost = 0, *pGET = 0; char hostBUFSIZ, GETBUFSIZ; char headerBUFSIZ = ; static

2、char textBUFSIZ; int i; /* * windows下使用socket必须用WSAStartup初始化,否则不能调用 */ if(WSAStartup(MAKEWORD(2,2), &WSAData) printf(WSA failedn); return; /* * 分离url中的主机地址和相对路径 */ strcpy(myurl, url); for (pHost = myurl; *pHost != / & *pHost != 0; +pHost); if ( (int)(pHost - myurl) = strlen(myurl) ) strcpy(GET, /);

3、 else strcpy(GET, pHost); *pHost = 0; strcpy(host, myurl); printf(%sn%sn, host, GET); /* * 设定socket参数,并未真正初始化 */ sockfd = socket(PF_INET, SOCK_STREAM, IPPROTO_TCP); pURL = gethostbyname(host); addr.sin_family = AF_INET; addr.sin_addr.s_addr = *(unsigned long*)pURL-h_addr); addr.sin_port = htons(80);

4、 /* * 组织发送到web服务器的信息 * 为何要发送下面的信息请参考HTTP协议的约定 */ strcat(header, GET ); strcat(header, GET); strcat(header, HTTP/1.1rn); strcat(header, HOST: ); strcat(header, host); strcat(header, rnConnection: Closernrn); /* * 连接到服务器,发送请求header,并接受反馈(即网页源代码) */ connect(sockfd,(SOCKADDR *)&addr,sizeof(addr); send(sockfd, header, strlen(header), 0); while ( recv(sockfd, text, BUFSIZ, 0) 0) printf(%s, text); strnset(text, 0, BUFSIZ); closesocket(sockfd); WSACleanup(); int main() char url256; printf(http:/); scanf(%s, url); geturl(url); return 0; /

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 国内外标准规范

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号