localStorage灵魂五问。 5M空间?? 10M !!!

灵魂五问

  1. localStorage 存储的键值采用什么字符编码
  2. 5M 的单位是什么
  3. localStorage 键占不占存储空间
  4. localStorage的键的数量,对写和读性能的影响
  5. 写个方法统计一个localStorage已使用空间

我们挨个解答,之后给各位面试官又多了一个面试题。

我们常说localStorage存储空间是5M,请问这个5M的单位是什么?

localStorage  存储的键值采用什么字符编码?

打开相对权威的MDN localStorage#description[1]

The keys and the values stored with localStorage are always in the UTF-16 `DOMString`[2] format, which uses two bytes per character. As with objects, integer keys are automatically converted to strings.

翻译成中文:

localStorage 存储的键和值始终采用 UTF-16 DOMString 格式,每个字符使用两个字节。与对象一样,整数键将自动转换为字符串。

答案:UTF-16

MDN这里描述的没有问题,也有问题,因为UTF-16,每个字符使用两个字节,是有前提条件的,就是码点小于0xFFFF(65535), 大于这个码点的是四个字节。

这是全文的关键。

5M 的单位是什么

5M的单位是什么?

选项:

  1. 字符的个数
  2. 字节数
  3. 字符的长度值
  4. bit 数
  5. utf-16编码单元

以前不知道,现代浏览器,准确的应该是 选项3,字符的长度 ,亦或 选项5, utf-16编码单元

字符的个数,并不等于字符的长度,这一点要知道:

"a".length // 1
"人".length // 1
"𠮷".length // 2
"🔴".length // 2

现代浏览器对字符串的处理是基于UTF-16 `DOMString`[3]

但是说5M字符串的长度,显然有那么点怪异。

而根据 UTF-16编码规则,要么2个字节,要么四个字节,所以不如说是 10M 的字节数,更为合理。

当然,2个字节作为一个utf-16的字符编码单元,也可以说是 5M 的utf-16的编码单元。

我们先编写一个utf-16字符串计算字节数的方法:非常简单,判断码点决定是2还是4

function sizeofUtf16Bytes(str) {
    var total = 0,
        charCode,
        i,
        len;
    for (i = 0, len = str.length; i < len; i++) {
        charCode = str.charCodeAt(i);
        if (charCode <= 0xffff) {
            total += 2;
        } else {
            total += 4;
        }
    }
    return total;
}
 

我们再根绝10M的字节数来存储

我们留下8个字节数作为key,8个字节可是普通的4个字符换,也可是码点大于65535的3个字符,也可是是组合。

下面的三个组合,都是可以的,

aaaa
aa🔴
🔴🔴

在此基础上增加任意一个字符,都会报错异常异常。

const charTxt = "人";
let count = (10 * 1024 * 1024 / 2) - 8 / 2;
let content = new Array(count).fill(charTxt).join("");
const key = "aa🔴";
localStorage.clear();
try {
    localStorage.setItem(key, content);
} catch (err) {
    console.log("err", err);
}

const sizeKey = sizeofUtf16Bytes(key);
const contentSize = sizeofUtf16Bytes(content);
console.log("key size:", sizeKey, content.length);
console.log("content size:", contentSize, content.length);
console.log("total size:", sizeKey + contentSize, content.length + key.length);

现代浏览器的情况下:

所以,说是10M的字节数,更为准确,也更容易让人理解。

如果说5M,那其单位就是字符串的长度,而不是字符数。

答案:字符串的长度值, 或者utf-16的编码单元

更合理的答案是 10M字节空间。

localStorage 键占不占存储空间

我们把 key和val各自设置长 2.5M的长度

const charTxt = "a";
let count = (2.5 * 1024 * 1024);
let content = new Array(count).fill(charTxt).join("");
const key = new Array(count).fill(charTxt).join("");
localStorage.clear();
try {
    console.time("setItem")
    localStorage.setItem(key, content);
    console.timeEnd("setItem")
} catch (err) {
    console.log("err code:", err.code);
    console.log("err message:", err.message)
}

执行正常。

我们把content的长度加1, 变为 2.5 M + 1, key的长度依旧是 2.5M的长度

const charTxt = "a";
let count = (2.5 * 1024 * 1024);
let content = new Array(count).fill(charTxt).join("") + 1;
const key = new Array(count).fill(charTxt).join("");
localStorage.clear();
try {
    console.time("setItem")
    localStorage.setItem(key, content);
    console.timeEnd("setItem")
} catch (err) {
    console.log("err code:", err.code);
    console.log("err message:", err.message)
}

产生异常,存储失败。至于更多异常详情吗,参见 localstorage_功能检测[4]

function storageAvailable(type) {
    var storage;
    try {
        storage = window[type];
        var x = '__storage_test__';
        storage.setItem(x, x);
        storage.removeItem(x);
        return true;
    }
    catch(e) {
        return e instanceof DOMException && (
            // everything except Firefox
            e.code === 22 ||
            // Firefox
            e.code === 1014 ||
            // test name field too, because code might not be present
            // everything except Firefox
            e.name === 'QuotaExceededError' ||
            // Firefox
            e.name === 'NS_ERROR_DOM_QUOTA_REACHED') &&
            // acknowledge QuotaExceededError only if there's something already stored
            (storage && storage.length !== 0);
    }
}

答案: 占空间

键的数量,对读写的影响

我们500 * 1000键,如下

let keyCount = 500 * 1000;

localStorage.clear();
for (let i = 0; i < keyCount; i++) {
    localStorage.setItem(i, "");
}

setTimeout(() => {
    console.time("save_cost");
    localStorage.setItem("a", "1");
    console.timeEnd("save_cost");
}, 2000)


setTimeout(() => {
    console.time("read_cost");
    localStorage.getItem("a");
    console.timeEnd("read_cost");

}, 2000)

// save_cost: 0.05615234375 ms
// read_cost: 0.008056640625 ms

你单独执行保存代码:

localStorage.clear();    
console.time("save_cost");
localStorage.setItem("a", "1");
console.timeEnd("save_cost");
// save_cost: 0.033203125 ms

可以多次测试, 影响肯定是有的,也仅仅是数倍,不是特别的大。

反过来,如果是保存的值表较大呢?

const charTxt = "a";
const count = 5 * 1024 * 1024  - 1
const val1 = new Array(count).fill(charTxt).join("");

setTimeout(() =>{
    localStorage.clear();
    console.time("save_cost_1");
    localStorage.setItem("a", val1);
    console.timeEnd("save_cost_1");
},1000)


setTimeout(() =>{
    localStorage.clear();
    console.time("save_cost_2");
    localStorage.setItem("a", "a");
    console.timeEnd("save_cost_2");
},1000)

// save_cost_1: 12.276123046875 ms
// save_cost_2: 0.010009765625 ms
 

可以多测试很多次,单次值的大小对存的性能影响非常大,读取也一样,合情合理之中。

所以尽量不要保存大的值,因为其是同步读取,纯大数据,用indexedDB就好。

答案:键的数量对读取性能有影响,但是不大。值的大小对性能影响更大,不建议保存大的数据。

写个方法统计一个localStorage已使用空间

现代浏览器的精写版本:

function sieOfLS() {
    return Object.entries(localStorage).map(v => v.join('')).join('').length;
}

测试代码:

localStorage.clear();
localStorage.setItem("🔴", 1);
localStorage.setItem("🔴🔴🔴🔴🔴🔴🔴🔴", 1111);
console.log("size:", sieOfLS())   // 23
// 🔴*9 + 1 *5 = 2*9 + 1*5 = 23

html的协议标准

WHATWG 超文本应用程序技术工作组 的localstorage[5] 协议定了localStorage的方法,属性等等,并没有明确规定其存储空间。也就导致各个浏览器的最大限制不一样。

其并不是ES的标准。

页面的utf-8编码

我们的html页面,经常会出现<meta charset="UTF-8">。告知浏览器此页面属于什么字符编码格式,下一步浏览器做好解码工作。

<head>
    <meta charset="UTF-8">
    <meta http-equiv="X-UA-Compatible" content="IE=edge">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>容器</title>
</head>

这和localStorage的存储没有半毛钱的关系。

localStorage扩容

localStorage的空间是 10M的字节数,一般情况是够用,可是人总是有贪欲。真达到了空间限制,怎么弄?

localStorage扩容就是一个话题。

引用

localStorage[6]

源文:程序员成长指北

posted @ 2022-02-23 08:50  久依  阅读(195)  评论(0编辑  收藏  举报