摘要: 最近看了一下吴军的数学之美。书很好,废话我就不多少了。看了第9章图论和网络爬虫,一直都觉得网络爬虫很牛B,搜索引擎不就是用爬虫爬网页的吗,于是想写一个简单的爬虫来爬网页试试,最先想到的就是给自己的博客建一个目录,够小够简单了吧,于是就有了这篇文章,简单的分享一下,先申明我的实现很简单没有技术含量,在看下文之前可以先看看 我的博客目录。 源码必共享简单介绍一下网络爬虫的原理:给你一个网页地址,先把这个网页下载下来,然后分析这个网页的内容,得到这个网页中的所有链接,然后下载这些网页,继续分析下载。这样就能下载互联网上的很多网页。原理就这么简单,实现起来就不那么容易了。由于深入不了只能说简单的。构造 阅读全文
posted @ 2013-02-20 15:38 啊汉 阅读(3255) 评论(12) 推荐(11) 编辑
摘要: C/C++(42)COM是一个更好的C++15道简单算法题非递归实现文件夹遍历《STL系列》之map原理及实现《STL系列》之vector原理及实现C#转C++的一点分享内存的分配VS回收&构造函数VS析构函数内存池的原理及实现构造函数产生的点及原因虚方法的调用是怎么实现的(单继承VS多继承)C++... 阅读全文
posted @ 2013-02-20 11:29 啊汉 阅读(3706) 评论(3) 推荐(1) 编辑