eaglet

本博专注于基于微软技术的搜索相关技术
  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理
上一页 1 ··· 9 10 11 12 13 14 15 16 17 ··· 19 下一页

2009年5月1日

摘要: 快速排序算法,网上相关文章已经介绍的很多了,数据结构教材中也有很详细的介绍。本文需要阐述的不是全排序快速排序算法,而是部分快速排序算法。所谓部分快速排序算法是指通过排序获取一个数列中最大的若干条有序记录。比如我们需要从一个有1百万记录的数组中获取前100条有序记录,并按从大到小顺序显示给用户,这种应用在搜索引擎中经常被使用,很少会有人有耐心将100万条搜索出来的记录都阅读一遍,一般阅读前几百条纪录就可以得到自己满意的答案。其实这种算法很像SQLSERVER 中的 TOP n 的实现,不过数据库是预先已经将记录通过B+树索引的方式进行了组织,实现方法完全不同。本文需要阐述的是不通过数据库,如何高效完成Top n 这种部分排序的功能。 阅读全文

posted @ 2009-05-01 14:44 eaglet 阅读(6127) 评论(5) 推荐(0) 编辑

2009年4月28日

摘要: Hubble.net 持久化方面3个重大改进 1.持久的DocId 2. 元数据快速修改 3. 高效的增量索引 阅读全文

posted @ 2009-04-28 11:18 eaglet 阅读(856) 评论(7) 推荐(0) 编辑

2009年4月27日

摘要: T-SFQL (Transact-Structured Full-text Query Language) 是在T-SQL 标准基础上衍生出来的结构化全文查询语言。2009年由Hubble.net 提出,语言全文数据库的查询和管理。 T-SFQL 0.1 版本为T-SFQL 语言推出的第一个版本。该版本只提供基本的“增删改查”功能。其他功能将逐渐在后续版本中提供。 阅读全文

posted @ 2009-04-27 18:37 eaglet 阅读(1244) 评论(12) 推荐(0) 编辑

2009年4月22日

摘要: 随着双核及多核CPU的不断普及,传统的排序算法已经不能满足新的硬件性能需求。如何充分利用多核CPU带给我们的性能提升成为设计算法时不得不考虑的一个新问题。为此我写了这个并行排序算法,充分利用多核CPU来进行并行计算,从而大大提高了排序的效率。 阅读全文

posted @ 2009-04-22 12:54 eaglet 阅读(11387) 评论(15) 推荐(0) 编辑

2009年3月13日

摘要: 我们经常听说 Google 有一套诡异的机制来检测无效点击,用来对付作弊者,但 Google 到底是怎么做到的呢?这篇文章归纳出 Google 用之以判断广告点击有效与否的方法。通常来说,Google 不会马上封掉你的帐户,他们会把你的帐户标记起来并进行特别监视,有时候还会给你寄警告信。 阅读全文

posted @ 2009-03-13 10:29 eaglet 阅读(1180) 评论(1) 推荐(1) 编辑

2009年3月12日

摘要: .Net 下的程序调试相对C/C++要简单很多,少了那些令人头疼的指针越界的问题。不过当你的程序遇到如下问题时,依然非常棘手: 1. 进程异常终止。 2. 内存泄漏或者内存申请后程序始终没有释放。 3. 线程因未知原因挂起,比如死锁。 4. 程序死循环。 本文将阐述如果编写程序对后两者故障实时跟踪并报告。 阅读全文

posted @ 2009-03-12 13:00 eaglet 阅读(9964) 评论(3) 推荐(4) 编辑

2009年3月11日

摘要: 昨天我在一篇博文中提到用 GetThreadTimes 这个Win32 API 来获取线程实际运行时间。今天我又深入研究了一下,发现这个API 返回的时间并不准确。 阅读全文

posted @ 2009-03-11 15:57 eaglet 阅读(5180) 评论(15) 推荐(0) 编辑

2009年3月10日

摘要: 早上看到老赵写的这个性能计数器,感觉很实用,不过老赵用了很多.C# 3.0 的新语法,还用了 VISTA 和 Server 2008 下特有的Win32 API,对于还在用C#2.0 或者还工作在 XP 或者 Server 2003 下的兄弟们,只能望代码心叹了。应老赵的要求,我修改了他的代码,增加了对低版本C# 和 低版本windows 操作系统的支持。 阅读全文

posted @ 2009-03-10 14:10 eaglet 阅读(12853) 评论(44) 推荐(5) 编辑

2009年2月17日

摘要: 随着.Net技术的发展,.Net技术被逐渐应用到很多大型的应用软件项目中。这些项目的规模越来越大,很多项目中除了自己的代码外还引用了很多第三方的.net组件。同时很多项目又被应用到很多关键的部门,软件系统的稳定性越来越至关重要。由于.Net 框架提供了非常强大的异常处理机制,同时对一些非托管代码很难控制的系统问题比如指针越界,内存泄漏等提供了很好的解决方案。相比非托管代码构建的系统,.Net构建的系统更加稳定。不过这并不是说.Net构建的系统就完全无懈可击,很多由于代码的不严谨或者系统问题引发的故障将会导致.Net应用程序产生未捕获异常,从而导致应用程序异常终止。本文将对三种最常见的.Net应用的未捕获异常处理进行阐述。 阅读全文

posted @ 2009-02-17 09:53 eaglet 阅读(19536) 评论(27) 推荐(2) 编辑

2009年2月16日

摘要: 这是一篇公司的内部培训教材,其中中的内容涵盖LUCENE的方方面面,从源代码角度深入剖析LUCENE,如果要对LUCENE有更加深入的了解(专家级别),这篇技术文档必不可少。 前提:对LUCENE有一定程度的了解,否则会让你云里雾里 阅读全文

posted @ 2009-02-16 14:53 eaglet 阅读(6156) 评论(3) 推荐(0) 编辑

上一页 1 ··· 9 10 11 12 13 14 15 16 17 ··· 19 下一页