摘要: 下面是一篇很有启发性的文章先分享给大家。 信息论的发展https://zhuanlan.zhihu.com/p/20841617 我们通过上一篇了解了爬虫具体要实现的工作之后,我们分析得出的网络爬虫的基本工作流程如下: 1.首先选取一部分精心挑选的种子URL; 2.将这些URL放入待抓取URL队列; 阅读全文
posted @ 2018-04-05 21:48 xintt 阅读(2836) 评论(0) 推荐(0) 编辑
摘要: Sendfile函数说明 #include ssize_t sendfile(int out_fd, int in_fd, off_t *offset, size_t count); sendfile()是作用于数据拷贝在两个文件描述符之间的操作函数.这个拷贝操作是内核中操作的,所以称为"零拷贝". 阅读全文
posted @ 2018-04-05 21:05 xintt 阅读(1271) 评论(0) 推荐(0) 编辑