会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
乐哈哈旅游视频网:
大智若愚 www.16lol.com
弱智da愚
博客园
首页
新随笔
联系
订阅
管理
随笔 - 186 文章 - 1 评论 - 149 阅读 -
93万
2007年4月3日
Crawler首次大规模爬行成功!
摘要: 无故障,非常稳健的完成了我对特定68所网络学院的抓取!系统开始抓取时间:2007年4月2日22:28: 22系统结束抓取时间:2007年4月3日01:53:05系统历时:3小时24分33秒抓取WEB页面:1,527,707,565byte总节点数(为纯文本页面,包含动态页面不含重复):89,388个其他链接信息为统计再内!
阅读全文
posted @ 2007-04-03 10:34 riky
阅读(710)
评论(2)
推荐(0)
编辑
昵称:
riky
园龄:
18年6个月
粉丝:
94
关注:
0
+加关注
<
2025年3月
>
日
一
二
三
四
五
六
23
24
25
26
27
28
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
1
2
3
4
5
搜索
常用链接
我的随笔
我的评论
我的参与
最新评论
我的标签
最新随笔
1.右键cmdshell
2.DBLINK使用实战
3.oracle 日期相关的东东和几个应用的例子
4.vnc.conf
5.1521 error1
6.多项目同步进行“交叉编译”
7.HIBERNATE 多表查询的解决方案
8.动态添加SWAP分区
9.中文正则式
10.消息处理2
随笔分类
(144)
InterNet Management(11)
java/c++/vc/jsp/js/ajax/dom/html/dhtml...(21)
My Special Mood In Xidian(8)
Search Engine(82)
stock-fund(3)
TRUMP SPOKEN ENGLISH&PRONNUCIATION COURSE(2)
vs2003/2005/.net/c#(17)
随笔档案
(186)
2011年10月(1)
2009年12月(1)
2009年11月(1)
2009年9月(1)
2009年8月(2)
2009年7月(1)
2009年6月(2)
2009年3月(3)
2009年2月(2)
2009年1月(5)
2008年12月(2)
2008年10月(13)
2008年9月(8)
2008年8月(2)
2008年7月(2)
2008年2月(9)
2007年8月(5)
2007年7月(1)
2007年6月(4)
2007年5月(25)
2007年4月(17)
2007年3月(16)
2007年2月(1)
2007年1月(16)
2006年12月(10)
2006年11月(24)
2006年10月(3)
2006年9月(8)
2006年8月(1)
相册
(2)
my faverate(2)
my faverate
http://www.ohloh.net/
http://www.sina22.com.cn/sina/tech/3852.htm
宙环科技实验室
编码相关
汉字编码查询2
汉字编码查询
SPserver
http://www.hsiu28.net/
perl
阅读排行榜
1. 解决“由于应用程序的配置不正确,应用程序未能启动,重新安装应用程序可能会纠正这个问题”(294032)
2. UML类图关系大全(207115)
3. linux 内核分析之list_head(30209)
4. proFTPd的使用配置(25615)
5. HTTP数据包头解析---之温故而知新!(24280)
6. 获取指定的系统路径 SHGetSpecialFolderPath(22169)
7. LINUX 常用命令集合(21343)
8. 网页流媒体播放器(21308)
9. errno .h(19244)
10. $$$$GB2312-80区位编码表$$$$(11392)
11. $$$$方正GBK字库内码表$$$$(10592)
12. Unix网络API(9481)
13. fatal error LNK1169: 找到一个或多个多重定义的符号(8063)
14. $,@,%__perl varibale!(7479)
15. list_head使用介绍(7304)
16. INF语法规则(6378)
17. 国内语料库建设一览表 (6333)
18. 有用的收藏!javascript/c#/asp.net(5240)
19. ASCII对照表(4465)
20. IE常见问题集(4452)
21. IE自动加载控件的完美解决方案(4370)
22. 统计词汇(4066)
23. CVS在Linux中的配置和使用(3972)
24. 分词系统研究完整版(3952)
25. rfc2396文档(3790)
26. string::size_type类型 (3623)
27. 文本聚类2(3489)
28. ICTCLAS分词系统简介2(3326)
29. TF-IDF讲义 来自GOOGLE黑板报(3136)
30. java script 技巧(3135)
31. cygwin中 unable get setup.ini from... 的错误问题(3035)
32. 超链分析算法(3014)
33. HIBERNATE 多表查询的解决方案(2842)
34. Posix线程编程指南(2795)
35. iis-cgi 初试~~~(2789)
36. 中文正则式(2736)
37. 关于sprintf 和 snprintf的自拷贝(2727)
38. cvs 命令收集~(2550)
39. char p[] 和 char *p(2479)
40. 折腾了2天的一个加密算法!使用了二进制和十六进制的转换!好玩很!bintohex hextobin bin2hex hex2bin(2470)
评论排行榜
1. 解决“由于应用程序的配置不正确,应用程序未能启动,重新安装应用程序可能会纠正这个问题”(43)
2. UML类图关系大全(34)
3. string::size_type类型 (6)
4. linux 内核分析之list_head(5)
5. linux 内存相关~~~~集~~(4)
6. Unix网络API(4)
7. 国内语料库建设一览表 (3)
8. 网页流媒体播放器(3)
9. IE常见问题集(2)
10. 论文撰写结束,数据填写中....(2)
11. LINUX 常用命令集合(2)
12. $$$$方正GBK字库内码表$$$$(2)
13. HTTP数据包头解析---之温故而知新!(2)
14. Crawler首次大规模爬行成功!(2)
15. 文本聚类2(2)
16. ICTCLAS分词系统简介2(2)
17. WEB超链分析算法纵览(2)
18. 统计词汇(2)
19. 关于矩阵运算和文本处理中的分类问题 来自Google 研究员,吴军(2)
20. TF-IDF讲义 来自GOOGLE黑板报(2)
21. list_head使用介绍(2)
22. TD->LTE(1)
23. LTE加快发展迎接商用(1)
24. 这篇关于野指针的文章写得太有个性了!收藏了(1)
25. 折腾了2天的一个加密算法!使用了二进制和十六进制的转换!好玩很!bintohex hextobin bin2hex hex2bin(1)
26. cgi 共享内存的问题(1)
27. 超链分析算法(1)
28. 大成功!(1)
29. 一个例子和我做的微秒级随机数产生器~~(1)
30. HashSearch 的实现(1)
31. 微笑王子~~王子(1)
32. 针对wmp11以后版本的流媒体播放解决的问题~(1)
33. 晕菜~~~竟然出了这样的事情~~(1)
34. VSM应用2(1)
35. char p[] 和 char *p(1)
36. not human being~~~(1)
37. 关于sprintf 和 snprintf的自拷贝(1)
38. stl相关(1)
39. Linux下网络编程(1)
40. sfp(1)
推荐排行榜
1. UML类图关系大全(64)
2. 解决“由于应用程序的配置不正确,应用程序未能启动,重新安装应用程序可能会纠正这个问题”(4)
3. HTTP数据包头解析---之温故而知新!(3)
4. linux 内核分析之list_head(2)
5. $,@,%__perl varibale!(1)
最新评论
1. Re:UML类图关系大全
UML软件设计与建模快乐之旅(精讲版)->
--IT技术老兵
2. Re:UML类图关系大全
谢谢您!
--qqqyyf
3. Re:UML类图关系大全
很赞
--liuhmmjj
4. Re:linux 内核分析之list_head
@ 春之晓者你仔细看看哈。...
--itfanr
5. Re:list_head使用介绍
终于把list_entry搞懂了,感谢你了,大神!
--向月车
6. Re:linux 内核分析之list_head
删除操作那一部分LIST_INIT_HEAD() 应改为INIT_LIST_HEAD()源码如下:/** * list_del_init - deletes entry from list and r...
--阿甘愣子
7. Re:UML类图关系大全
真是个好东西,正好要用!
--Akria
8. Re:HTTP数据包头解析---之温故而知新!
mark
--寻风问雨
9. Re:UML类图关系大全
非常好的总结,学习了
--媛小慕
10. Re:UML类图关系大全
很好,通俗易懂
--jet.lin
11. Re:UML类图关系大全
多谢楼主,非常适合入门
--TO_BE_RM
12. Re:UML类图关系大全
写得很不错,再让我温习了一次。
--疯狂的老爹
13. Re:ICTCLAS分词系统简介2
不错,不错。
--规格严格-功夫到家
14. Re:UML类图关系大全
文章看起来很舒服,博主,请问文中蓝色表格使用什么工具画的呢?
--jptiancai
15. Re:char p[] 和 char *p
讲的还不是很清晰哟!~~可以再整理一下~
--wkhuahuo
16. Re:TF-IDF讲义 来自GOOGLE黑板报
谢谢楼主
--ebull
17. Re:网页流媒体播放器
有源代码吗? 谢谢! 373550844@qq.com
--程序只是一小部分
18. Re:Unix网络API
很好!
--净坛使者
19. Re:list_head使用介绍
哈哈··精妙的C指针技法啊,学习了!
--luoyo
20. Re:LTE加快发展迎接商用
1:背英语 专业名词 课件文章理解。2:编程 数据处理 计算机和语言以及数据库基础。绘图路测软件使用。 3:高数知识 逻辑能力分析能力以及动手能力。4:出差吃苦 只有男生 团队合作能力,抗压能力。通信...
--鹏程
21. Re:TD->LTE
1:背英语 专业名词 课件文章理解。2:编程 数据处理 计算机和语言以及数据库基础。绘图路测软件使用。 3:高数知识 逻辑能力分析能力以及动手能力。4:出差吃苦 只有男生 团队合作能力,抗压能力。通信...
--鹏程
22. Re:UML类图关系大全
太感谢了,刚好复习考试用到。楼主辛苦了。
--唇涙
23. Re:UML类图关系大全
很全,受教了,谢谢。请问单向关联实现中:class C3 {public: C4* theC4;};class C4 {};存在C4* theC4这个字段。在C#中不应该会有出现指针吧,那样岂不是实现...
--hedgehog_zsw
24. Re:linux 内核分析之list_head
博主的图有问题,list->next不应该指向结构体的头部,而是应该指向list成员的吧
--春之晓者
25. Re:linux 内核分析之list_head
@ L-joker这样写没错吧。first是list->next....
--morphling.huang
26. Re:UML类图关系大全
写得太好了,这几天也正在学习这方面的知识,感谢楼主分享
--青香蕉
27. Re:网页流媒体播放器
能播放什么类型的文件啊,能把源码给我发一下吗,谢谢,我邮箱地址:853695658@qq.com
--爱拼@才会赢
28. Re:解决“由于应用程序的配置不正确,应用程序未能启动,重新安装应用程序可能会纠正这个问题”
引用李永豪:楼主,我跟本找不到你说的那些msvcm80d.dll……东西啊!那咋办?我的电脑连下载都不行了……求助了,谢谢<br/><br/>我也出现的是同样现像现在,那些方法我也找不到,现在可急了...
--laner2012
29. Re:解决“由于应用程序的配置不正确,应用程序未能启动,重新安装应用程序可能会纠正这个问题”
引用死:方法一:<br/>在类似C:\Program Files\Microsoft Visual Studio 8\VC\redi<br/>st\Debug_NonRedist\x86\Micros...
--laner2012
30. Re:ICTCLAS分词系统简介2
你好,我看了你上边的分词简介后。在那个计算各个词组之间的关联性(耦合度)这边看不懂了。你上线的时候能给我恢复下么?或者是QQ下我好么?我正在研究这分词,希望能和你交流下。。我的扣扣:553806198
--Bill_Jobs
31. Re:linux 内核分析之list_head
在合并操作那里,有点小疑问:static inline void list_splice(struct list_head *list, struct list_head *head)参数list和h...
--L-joker
32. Re:有用的收藏!javascript/c#/asp.net
诶,收藏了很多好东西,真的是放进保险箱了,不怕找不到了,但是很少会去再重新看它,虽然知道温故而知新,诶。。。
--leroylei
33. Re:UML类图关系大全
很易懂,学习了。楼主辛苦
--dragon7l
34. Re:解决“由于应用程序的配置不正确,应用程序未能启动,重新安装应用程序可能会纠正这个问题”
赞
--Carbo
35. Re:UML类图关系大全
谢谢楼主
--Raontie~.1
36. Re:UML类图关系大全
很好,赞
--stonehat
37. Re:not human being~~~
运行会出错啊???
--jid_223
38. Re:UML类图关系大全
谢谢,学习了.
--i晕呀
39. Re:TF-IDF讲义 来自GOOGLE黑板报
写的太好了,特别是在“原子能的应用”的搜索举例很有代表性,我在没有TF-IDF概念的情况下看了很长时间的Lucene,就是不明白数学计算公式为什么是那个样子的,有一这些概念后,再看真是豁然开朗。
--jince007
40. Re:UML类图关系大全
学习。
--ice_lance
乐哈哈旅游视频网:
点击右上角即可分享