12 2011 档案

摘要:Nutch采用了一种命令的方式进行工作,其命令可以是对局域网方式的单一命令也可以是对整个Web进行爬取的分步命令。主要的命令如下: 1. Crawl Crawl是“org.apache.nutch.crawl.Crawl”的别称,它是一个完整的爬取和索引过程命令。 使用方法: Shell代码 bin/nutch crawl <urlDir> [-dir d] [-threads n] [-depth i] [-topN] bin/nutch crawl <urlDir> [-dir d] [-threads n] [-depth i] [-topN] 参数说明: < 阅读全文
posted @ 2011-12-28 15:14 ljlxyf 阅读(331) 评论(0) 推荐(0) 编辑
摘要:Nutch作为一款刚刚诞生的开源Web搜索引擎,提供了除商业搜索引擎外的一种新的选择。个人、企业都可通过Nutch来构建适合于自身需要的搜索引擎平台,提供适合于自身的搜索服务,而不必完全被动接收商业搜索引擎的各种约束。Nutch 是基于Lucene的。Lucene为 Nutch 提供了文本索引和搜索的API。如果你不需要抓取数据的话,应该使用Lucene。常见的应用场合是:你有数据源,需要为这些数据提供一个搜索页面。在这 种情况下,最好的方式是直接从数据库中取出数据并用Lucene API建立索引。Nutch 适用于你无法直接获取数据库中的数据网站,或者比较分散的数据源的情况下使用。Nutch 阅读全文
posted @ 2011-12-27 17:16 ljlxyf 阅读(776) 评论(1) 推荐(0) 编辑
摘要:传说中nginx要比apache的负载均衡好的多,堪称神器 。 奈何,本人一直对新鲜事物不感冒。不过服务器上面有很多都是用nginx来做http服务器,今天偷闲了解一下。上网上搜了一下,大多数都是介绍 linux下的nginx与php的配置。本人现在在windows下面想尝试一下,发现资料并不多,且并不是很准确。其间也遇到了很多问题,还好折腾了 几次总算搞定了。下面说一下windows下面nginx和php的配置,不对的地方大家多担待。准备资源: 原来我在用APM,很好用,集成了Apache,PHP和MySQL。这次把它关掉需要重新下载这三个文件。资源一定要准备好,不然玩不转啊。呵呵。Ngin 阅读全文
posted @ 2011-12-27 15:02 ljlxyf 阅读(390) 评论(0) 推荐(0) 编辑
摘要:任务调度的crond常驻命令 crond 是linux用来定期执行程序的命令。当安装完成操作系统之后,默认便会启动此任务调度命令。crond命令每分锺会定期检查是否有要执行的工作,如果有要执行的工作便会自动执行该工作。而linux任务调度的工作主要分为以下两类: 1、系统执行的工作:系统周期性所要执行的工作,如备份系统数据、清理缓存 2、个人执行的工作:某个用户定期要做的工作,例如每隔10分钟检查邮件服务器是否有新信,这些工作可由每个用户自行设置 Crontab是UNIX系统下的定时任务触发器,其使用者的权限记载在下列两个文件中: 文件 含义 /etc/cron.deny ... 阅读全文
posted @ 2011-12-20 13:22 ljlxyf 阅读(158) 评论(0) 推荐(0) 编辑
摘要:今天同事A找到我,说是Mysql server X的负载很高,查询很慢。他自己捣鼓了一阵未果后,我们一起看了下。[root@redhat var]# uname -aLinux xxx 2.6.18-128.el5 #1 SMP Wed Dec 17 11:41:38 EST 2008 x86_64 x86_64 x86_64 GNU/Linux[root@redhat var]# mysql -u root -p -e "select version();"+------------+| version() |+------------+| 5.1.32-log |+-- 阅读全文
posted @ 2011-12-20 09:53 ljlxyf 阅读(234) 评论(0) 推荐(0) 编辑
摘要:Android系统在2.1版本之前,应用程序是只能安装到机身内存(RAM)中,这一特性从某种角度上讲,阻止了Android的发展,因为RAM的空间是有限的,所以这一特性限制了应用程序的体积,也就限制了应用程序的功能。 自从Android 2.2版本开始,Android系统引入了一个全新的功能——APP2SD,这个功能让Android系统允许将应用程序安装到SD卡上面,一方面节约出更多的RAM空间,另一方面也允许应用程序扩大自身的体积。 但是仅仅Android系统支持APP2SD,这样还是不够的,应用程序如果不经过处理,仍然会一如既往的转进RAM里。这是因为Android系统 保持向后兼... 阅读全文
posted @ 2011-12-16 08:52 ljlxyf 阅读(345) 评论(0) 推荐(0) 编辑
摘要:对Unix,Linux类服务器维护经常是通过ssh完成的,而有些操作比较费时,如更新程序等。此时如果断开ssh连接的话,更新程序就会随之被中断。如何保证断开ssh后仍旧能保持更新进程的运行呢?有两种方法:(1)nohup#nohup 应用程序名 &此后,如果你断开了ssh,程序依旧运行。此种方式的缺点是,应用程序没有交互界面了,程序的输出将会输出的一个xxx.out文件中,而且以后无法在界面控制程序的结束。必须通过kill的方式。所以这种方式显得很简单粗鲁,很少使用。(http://www.my400800.cn )(2)screen#screen回车后进入Screen子界面,此时pu 阅读全文
posted @ 2011-12-12 16:12 ljlxyf 阅读(340) 评论(0) 推荐(0) 编辑
摘要:要完成这些操作,Windows内必须有完整的PuTTy安装包而不仅仅是putty.exe这一个文件putty.zip 下载open calpico.dreamhost.com 用于连接远程linux服务器,其中calpico.dreamhost.com替换为您自己的地址。cd public_html/wp-content/ 用于切换远程Linux服务器上的目录,其中public_html/wp-contnt替换为您自己实际的路径。(http://www.my400800.cn )lcd D:/downloads/ 用于切换本地的路径,其中D:/downloads/就是我自己电脑里的D:\do. 阅读全文
posted @ 2011-12-12 09:00 ljlxyf 阅读(979) 评论(0) 推荐(0) 编辑
摘要:.tar 解包:tar xvf FileName.tar 打包:tar cvf FileName.tar DirName (注:tar是打包,不是压缩!) ——————————————— .gz 解压1:gunzip FileName.gz 解压2:gzip -d FileName.gz 压缩:gzip FileName.tar.gz 和 .tgz 解压:tar zxvf FileName.tar.gz 压缩:tar zcvf FileName.tar.gz DirName ——————————————— .bz2 解压1:bzip2 -d FileName.bz2 解压2:bunzip2 . 阅读全文
posted @ 2011-12-12 08:54 ljlxyf 阅读(230) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示