上一页 1 ··· 22 23 24 25 26 27 28 29 30 ··· 48 下一页
摘要: 目前在做Perl页面爬虫的模块,发现一些代码,做个详细的分析,把好的引用一下给自己用用。 1 #!/usr/bin/perl -w 2 3 use strict; 4 5 use HTTP::Request; 6 use HTTP::Status; 7 use HTML::LinkExtor; 8 use URI::URL; 9 use LWP::UserAgent; 10 #use Digest::MD5 qw(md5_hex); 11 12 13 use Compress::Zlib; 14 15 ###################... 阅读全文
posted @ 2013-05-15 16:02 墨迹哥's 阅读(395) 评论(0) 推荐(0) 编辑
摘要: 今晚搭建了一个PECL的环境。在uBUNTU的server版上搭建了这么个环境,在过程当中发现了官方的包受到损坏,瞬间蛋疼了。只能gg找办法。现在方法如下:传送门:http://askubuntu.com/questions/245996/unable-to-install-pecl-extension-for-perl-in-ubuntu-server-12-10 阅读全文
posted @ 2013-05-15 00:22 墨迹哥's 阅读(134) 评论(0) 推荐(0) 编辑
摘要: 具体的请根据个人需要修改代码。 #!/usr/local/bin/perl5 use warnings; use strict; use Fcntl; use Term::Cap; use Parallel::ForkManager; #============================== # for terminal control #============================== my $termios = new POSIX::Termios; my $terminal = Term::Cap->Tge... 阅读全文
posted @ 2013-05-11 00:39 墨迹哥's 阅读(433) 评论(0) 推荐(0) 编辑
摘要: 在安装Tk的过程当中各种错误,让人无比的蛋疼。记录下过程,方便以后回顾学习。第一个错误: Going to read '/root/.cpan/Metadata' Database was generated on Thu, 09 May 2013 04:17:04 GMT Running install for module 'Tk' Running make for S/SR/SREZIC/Tk-804.030.tar.gz Checksum for /root/.cpan/sources/authors/id/S/SR/SREZIC/Tk-804.030. 阅读全文
posted @ 2013-05-09 17:02 墨迹哥's 阅读(832) 评论(0) 推荐(0) 编辑
摘要: 分析了下代码,之前官方那段其实很简单,只要理解了,就能随意改动了。根据自己的想法,目前想做的是全方位爬虫,并不是类似如此简单的爬,简单的整理了下这个单例的抓URL。效果一般般,这几天忙完事情,我就改成多线程。把URL的深度选项加入,以及可定向操作级别。这东西是我一直在思考的东西,也是我的一个想法。把单例的例子保存下,方便以后翻。#!/usr/bin/perluse LWP::UserAgent;use HTML::LinkExtor;use URI::URL;@imgs=();test("http://www.baidu.com/s?wd=dd");sub test{ lo 阅读全文
posted @ 2013-05-08 17:17 墨迹哥's 阅读(251) 评论(0) 推荐(0) 编辑
上一页 1 ··· 22 23 24 25 26 27 28 29 30 ··· 48 下一页