博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

js伪哈希表

Posted on 2010-07-05 16:26  郭子  阅读(3214)  评论(0编辑  收藏  举报
了解数据结构的人应该都听说过哈希表这种数据结构,它是一种典型的利用键值对存储并检索数据的一种非线性结构,又称散列表或杂凑法。在一般的线性表结构中,数据的相对位置是随机的,即数据和用于检索的关键字之间不存在确定的关系,检索数据时往往需要进行一系列的比较,最终找到要检索的数据,这种方法往往建立在循环比较的机制上,利用时间的代价节省了空间,实现了数据的存储和检索功能。而哈希表则使用键值对进行数据的存储,在数据的存储位置和它的关键字之间建立了一一对应的关系,从而使每个关键字和结构中的一个唯一的存储位置相对应,所以在检索数据时,只需要根据这个对应关系便可快速定位到要查找的数据。

    事实上,我们通常并不关心数据是如何存储的,而关心的是我们在使用数据的时候是否方便,例如对数据进行排序、查找、替换等操作,由于这种操作是贯穿在整个应用程序始终的,因此对效率的要求也就很高了。一般的高级语言,如C和C的变种,都提供了用于存储哈希表的数据结构,但在弱类型语言中,如javascript等脚本语言,本身并没有直接提供类似于哈希表的这种结构,不过我们可以从数组出发,按照哈希表的原理自己打造一个脚本语言专有的哈希表数据结构。

    我们知道,在数据中,可以通过下标直接定位到相应数据,也就是用于存储数据的空间,数组的这种特性本身就决定了它可以被用来实现哈希算法,不过在C语言中,数组的下标只能是从0开始的整数,而不能为其它类型的数据,但在javascript中,我们可以借用“对象”这个概念,按照数组的特性来模拟哈希算法。因为在javascript中,对象其实就是属性或方法的一个集合,于是我们可以构造一个Hashtable对象,它有key和value两个属性,自己编写代码来模拟一个完整的哈希表。下面是一段在javascript中实现哈希表的代码:
  1. 1 function Hashtable() 
  2. 2 {
  3. 3  this._hash = {};
  4. 4  this._count = 0;
  5. 5  this.add = function(key, value) 
  6. 6  {
  7. 7      if (this._hash.hasOwnProperty(key)) return false;
  8. 8      else { this._hash[key] = value; this._count++; return true; }
  9. 9  }
  10. 10  this.remove = function(key) { delete this._hash[key]; this._count--; }
  11. 11  this.count = function() { return this._count; }
  12. 12  this.items = function(key) { if (this.contains(key)) return this._hash[key]; }
  13. 13  this.contains = function(key) { return this._hash.hasOwnProperty(key); }
  14. 14  this.clear = function() { this._hash = {}; this._count = 0; }
  15. 15 }
复制代码
实现起来很简单,我们在function中定义了一个_hash对象,该对象有一个属性key,我们可以给这个属性赋值,hasOwnProperty方法是javascript提供的方法,用于返回指定的对象中是否包含某个属性。同时我们在该function中还定义了一个_count对象,用于记录Hashtable中的数据个数,因为我们不想每次获取Hashtable中的数据个数时都要通过一个内置的循环来计数,这样开销就会小一些,前面说了,哈希算法的一个基本特性就是效率高。delete语句在javascript中用于销毁一个对象。

    下面是使用该Hashtable的一些例子:
  1. 1 var hashCompany = new Hashtable();
  2. 2
  3. 3 //向Hashtable中添加键值对
  4. 4 function FillData(arr) {
  5. 5    hashCompany.clear();
  6. 6
  7. 7    for (var i = 0; i < arr.length - 1; i++) {
  8. 8        if (arr != "") {
  9. 9            t = arr.split("`");
  10. 10            if (t.length > 2) {
  11. 11                if (!hashCompany.contains(t[0].trim())) {
  12. 12                    hashCompany.add(t[0].trim(), t[1]);
  13. 13                }
  14. 14            }
  15. 15        }
  16. 16    }
  17. 17 }
  18. 18
  19. 19 //遍历Hashtable并取出值
  20. 20 function GetDataFromHash() {
  21. 21    var s;
  22. 22    if (hashCompany.count > 0) {
  23. 23        for (var i in hashCompany._hash) {
  24. 24            s += i + "|";
  25. 25        }
  26. 26    }
  27. 27
  28. 28    if (s.length > 0) {
  29. 29        s = s.substring(0, s.length - 2);
  30. 30    }
  31. 31
  32. 32    return s;
  33. 33 }
复制代码
代码比较简单,这里就不再多加说明了,其中用到了一个trim函数,下面补上。
  1. //采用正则表达式去除字符串两端的空格,匿名函数用于扩展String对象的方法
  2. String.prototype.trim = function() { return this.replace(/(^\s*)|(\s*$)/g, ""); }
复制代码
哈希表在代码中使用频率很高,灵活使用哈希表可以简化代码并提供诸多方便,尤其是在存储类似于数组的数据并且希望之后能够方便检索。将代码保存于此,以备日后使用。