乐哈哈旅游视频网:
随笔 - 186  文章 - 1  评论 - 149  阅读 - 93万

随笔分类 -  Search Engine

1 2 3 4 5 下一页
crawler/index/indexing/cluster
多项目同步进行“交叉编译”
摘要:最近搞的几个项目同并不进行,着实有点累了呵呵不过很兴奋,很满足!SPRING+STRUTS+HIBERNATE构架应用的管理系统多问题第解决点滴回顾如下:映射,主键类型的修改。公共数据的存取问题。多条件模糊查询的问题视图的建立和使用https安全访问证书的制作和签发,linux open ssl其他....linux proc 项目攻坚oracle 10g环境搭建配置tools 公共库的添加修改,... 阅读全文
posted @ 2009-08-22 17:01 riky 阅读(565) 评论(0) 推荐(0) 编辑
动态添加SWAP分区
摘要:在SWAP空间不够用的情况下,如何手工添加SWAP空间?以下的操作都要在root用户下进行:  首先先建立一个分区,采用dd命令比如   dd if=/dev/zero of=/home/swap bs=1024 count=512000   这样就会创建/home/swap这么一个分区文件。文件的大小是512000个block,一般情况下1个block为1K,所以这里空间是512M。接着再把这个... 阅读全文
posted @ 2009-06-29 09:03 riky 阅读(1014) 评论(0) 推荐(0) 编辑
errno .h
摘要:errno.h- - 查看错误代码errno是调试程序的一个重要方法。当linuc C api函数发生异常时,一般会将errno变量(需include errno.h)赋一个整数值,不同的值表示不同的含义,可以通过查看该值推测出错的原因。在实际编程中用这一招解决了不少原本看来莫名其妙的问题。比较麻烦的是每次都要去lin... 阅读全文
posted @ 2008-02-02 16:58 riky 阅读(19244) 评论(0) 推荐(0) 编辑
pagerank,矩阵计算
摘要:pagerank 通过对由超过 50,000 万个变量和 20 亿个词汇组成的方程进行计算,PageRank 能够对网页的重要性做出客观的评价。PageRank 并不计算直接链接的数量,而是将从网页 A 指向网页 B 的链接解释为由网页 A 对网页 B 所投的一票。这样,PageRank 会根据网页 B 所收到的投票... 阅读全文
posted @ 2007-08-26 10:20 riky 阅读(1728) 评论(0) 推荐(0) 编辑
超链分析算法
摘要:2.WEB超链分析算法 2.1 Google和PageRank算法 搜索引擎Google最初是斯坦福大学的博士研究生Sergey Brin和Lawrence Page实现的一个原型系统[2],现在已经发展成为WWW上最好的搜索引擎之一。Google的体系结构类似于传统的搜索引擎,它与传统的搜索引擎最大的不同处在于对网页进行了基于权威值的排序处理,使最重要的网页出现在结果的最前面... 阅读全文
posted @ 2007-08-26 09:34 riky 阅读(3014) 评论(1) 推荐(1) 编辑
论文撰写结束,数据填写中....
摘要:本以为数据填充会简单点,没想到做了这么多工作,还不能很好的拿出数据来主要是程序本来处理的比较好时添加了实验的数据统计模块,这些模块的差错导致系统的段错误!经过3天的时间这个问题终于解决了~~现在能够正确的采集实验数据了!下面是部分数据的填充工作: 词组类型 ... 阅读全文
posted @ 2007-06-11 15:28 riky 阅读(705) 评论(2) 推荐(0) 编辑
linux经典问题——基础篇
摘要:linux经典问题——基础篇 0001 修改主机名 vi /etc/sysconfig/network,修改HOSTNAME一行为HOSTNAME=主机名,重启后也能生效 0002 Ret Hat Linux启动到文字界面(不启动xwindow) 将/etc/inittab中 id:5:initdefault: 一行中的5改为3 00... 阅读全文
posted @ 2007-05-27 17:40 riky 阅读(1027) 评论(0) 推荐(0) 编辑
一个例子和我做的微秒级随机数产生器~~
摘要:Linux的时间表示和计算函数 时间的表示 时间的测量 计时器的使用 1。时间表示 在程序当中,我们经常要输出系统当前的时间,比如我们使用date命令的输出结果.这个时候我们可以使用下面两个函数 #include time_t time(time_t *tloc); char *ctime(const time_t *clock); time函数返回从1970年1月1日0点以来的秒数.存储在ti... 阅读全文
posted @ 2007-05-24 16:46 riky 阅读(2027) 评论(1) 推荐(0) 编辑
HashSearch 的实现
摘要:下面这段代码的哈希实现体我觉得有不是很托的地方,哈希表建立最好只存放键值,不用把关键词结构也放进去,因为哈希表大小一般为关键词表的很多倍,为了散列效果好,你必须吧键值表高的大点以实现很好的散列。这里的程序把关键词也放进哈希表中但是却没用,我觉得不是很好的实现方式,分开,做成两个不同的表,实现效果可能更好~ 1/**//* 2* Copyright (c) 2005 All rights re... 阅读全文
posted @ 2007-05-24 11:00 riky 阅读(1011) 评论(1) 推荐(0) 编辑
一个计算程序运行耗时的代码段
摘要:1#include "time.h" 2 3// 时间变量与时间函数 4clock_t tstart = 0; 5 6 7void Settime() 8 { 9 tstart = clock(); 10}11 1213double Gettime()14 {15 return (double)((double)clock() - (double)tstart)/(double)C... 阅读全文
posted @ 2007-05-24 10:52 riky 阅读(979) 评论(0) 推荐(0) 编辑
一个HASH算法的设计~~
摘要: 阅读全文
posted @ 2007-05-23 18:36 riky 阅读(1739) 评论(0) 推荐(0) 编辑
词典建立过程缓慢的解决~~子系统构架重新设计!
摘要:由于当程序的运行,词典的数量将大大增大,刚开始词典小时速度还挺快的,可是当达到10W以上的数据量是明显速度下降,到达12w的时候已经不能忍受,之前一位是内存等的问题建立了终端现场保护机制。但从新启动现场发现意义不大。经过几番查找到深夜2点多发现原因:词典太大,频繁的对词典的查找速度太慢!!解决:散列算法的设计!解决中.......具体请看下次日志记录~~至于是什么时候~~我也不知道咬~~~ 阅读全文
posted @ 2007-05-23 11:37 riky 阅读(513) 评论(0) 推荐(0) 编辑
我的老天呀1G的内存都快用完了
摘要:我的老天呀1G的内存都快用完了,这才是处理个200兆的文件的文件内存使用率竟然:+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ -/+ buffers/cache: 181411840 871022592Swap: 5239492608 5173248 5234319360 t... 阅读全文
posted @ 2007-05-20 09:52 riky 阅读(643) 评论(0) 推荐(0) 编辑
list 字符查找
摘要:.... //for(its=StopWordL.begin();its!=StopWordL.end();its++){ //if(TermToDic.compare(*its)==0) { // cout<<"## stop word"<<*its<<endl; //return false; // }//is a stop word ... 阅读全文
posted @ 2007-05-16 22:51 riky 阅读(694) 评论(0) 推荐(0) 编辑
一个使用AJAX动态改变页面刷新的东东~~
摘要:不错,ajax可以实现。 不过远水解不了近渴,而且不一定适合你的环境。你完全可以借鉴ajax的核心思想,那就是用XMLHttpRequest对象。 下面是一个简单的例子: 上面的例子存成一个html文件,自己加上脚本定时调用loadXMLDoc("data.txt"... 阅读全文
posted @ 2007-05-10 09:42 riky 阅读(1336) 评论(0) 推荐(0) 编辑
CGI服务配置~~~
摘要:[原创]本文假定你已经安装好linux(本文的linux版本为Fedora Core3), 并具有root权限.1,安装apache 首先到apache的主页下载最新版本的apache http server,地址为 http://httpd.apache.org/本文写于2006.4.29,apache版本为2.2.0 .如果你也想用这一个版本的话请点击:http://mir... 阅读全文
posted @ 2007-05-10 09:38 riky 阅读(2302) 评论(0) 推荐(0) 编辑
CGI做中文处理时的问题!
摘要:#include #include int main(void) { unsigned int i=0,max=30; char* dest; dest=(char*)malloc(max); if(!dest)exit (1); printf("input your ... 阅读全文
posted @ 2007-05-10 09:32 riky 阅读(553) 评论(0) 推荐(0) 编辑
The Fourth Large-scale Test
摘要:********************************************* XDSE RAW data Crawling.... Begin at:Tue, 08 May 2007 00:18:27 GMT closed all threads Finished to Crawling WebRawData! : ) End at:Tue, 08 May 2007 02:33:0... 阅读全文
posted @ 2007-05-09 09:25 riky 阅读(746) 评论(0) 推荐(0) 编辑
搜索引擎编码--收集~
摘要:国家标准GB18030-2000《信息交换用汉字编码字符集 基本集的扩充》是我国继GB2312-1980和GB13000-1993之后最重要的汉字编码标准,是未来我国计算机系统必须遵循的基础性标准之一。为保证该标准顺利贯彻执行,国家质监总局将在9月1日起首先对影响广泛的计算机操作系统进行执法检查,凡不符合该标准的产品,视为不合格产品。为此,全国信息技术标准化技术委员会将根据有关标准和规范,组织... 阅读全文
posted @ 2007-05-08 16:11 riky 阅读(1428) 评论(0) 推荐(0) 编辑
晕菜~~~竟然出了这样的事情~~
摘要:別别差別差别看出点名堂了没~?差别~?我也不知道在那儿~~研究中~~不是GB2312的字符,也不是BIG5的字符难道是GB扩展~~ 阅读全文
posted @ 2007-05-07 22:31 riky 阅读(527) 评论(1) 推荐(0) 编辑

1 2 3 4 5 下一页
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

乐哈哈旅游视频网:
点击右上角即可分享
微信分享提示