localStorage灵魂五问。 5M空间?? 10M !!!
灵魂五问
- localStorage 存储的键值采用什么字符编码
- 5M 的单位是什么
- localStorage 键占不占存储空间
- localStorage的键的数量,对写和读性能的影响
- 写个方法统计一个localStorage已使用空间
我们挨个解答,之后给各位面试官又多了一个面试题。
我们常说localStorage存储空间是5M,请问这个5M的单位是什么?
localStorage 存储的键值采用什么字符编码?
打开相对权威的MDN localStorage#description[1]
The keys and the values stored with
localStorage
are always in the UTF-16 `DOMString`[2] format, which uses two bytes per character. As with objects, integer keys are automatically converted to strings.
翻译成中文:
localStorage 存储的键和值始终采用 UTF-16 DOMString 格式,每个字符使用两个字节。与对象一样,整数键将自动转换为字符串。
答案:UTF-16
MDN这里描述的没有问题,也有问题,因为UTF-16,每个字符使用两个字节,是有前提条件的,就是码点小于0xFFFF
(65535), 大于这个码点的是四个字节。
这是全文的关键。
5M 的单位是什么
5M的单位是什么?
选项:
- 字符的个数
- 字节数
- 字符的长度值
- bit 数
- utf-16编码单元
以前不知道,现代浏览器,准确的应该是 选项3,字符的长度 ,亦或 选项5, utf-16编码单元
字符的个数,并不等于字符的长度,这一点要知道:
"a".length // 1 "人".length // 1 "𠮷".length // 2 "🔴".length // 2
现代浏览器对字符串的处理是基于UTF-16 `DOMString`[3]。
但是说5M字符串的长度,显然有那么点怪异。
而根据 UTF-16编码规则,要么2个字节,要么四个字节,所以不如说是 10M 的字节数,更为合理。
当然,2个字节作为一个utf-16的字符编码单元,也可以说是 5M 的utf-16的编码单元。
我们先编写一个utf-16字符串计算字节数的方法:非常简单,判断码点决定是2还是4
function sizeofUtf16Bytes(str) { var total = 0, charCode, i, len; for (i = 0, len = str.length; i < len; i++) { charCode = str.charCodeAt(i); if (charCode <= 0xffff) { total += 2; } else { total += 4; } } return total; }
我们再根绝10M的字节数来存储
我们留下8个字节数作为key,8个字节可是普通的4个字符换,也可是码点大于65535的3个字符,也可是是组合。
下面的三个组合,都是可以的,
aaaa
aa🔴
🔴🔴
在此基础上增加任意一个字符,都会报错异常异常。
const charTxt = "人"; let count = (10 * 1024 * 1024 / 2) - 8 / 2; let content = new Array(count).fill(charTxt).join(""); const key = "aa🔴"; localStorage.clear(); try { localStorage.setItem(key, content); } catch (err) { console.log("err", err); } const sizeKey = sizeofUtf16Bytes(key); const contentSize = sizeofUtf16Bytes(content); console.log("key size:", sizeKey, content.length); console.log("content size:", contentSize, content.length); console.log("total size:", sizeKey + contentSize, content.length + key.length);
现代浏览器的情况下:
所以,说是10M的字节数,更为准确,也更容易让人理解。
如果说5M,那其单位就是字符串的长度,而不是字符数。
答案:字符串的长度值, 或者utf-16的编码单元
更合理的答案是 10M字节空间。
localStorage 键占不占存储空间
我们把 key和val各自设置长 2.5M的长度
const charTxt = "a"; let count = (2.5 * 1024 * 1024); let content = new Array(count).fill(charTxt).join(""); const key = new Array(count).fill(charTxt).join(""); localStorage.clear(); try { console.time("setItem") localStorage.setItem(key, content); console.timeEnd("setItem") } catch (err) { console.log("err code:", err.code); console.log("err message:", err.message) }
执行正常。
我们把content的长度加1
, 变为 2.5 M + 1
, key的长度依旧是 2.5M
的长度
const charTxt = "a"; let count = (2.5 * 1024 * 1024); let content = new Array(count).fill(charTxt).join("") + 1; const key = new Array(count).fill(charTxt).join(""); localStorage.clear(); try { console.time("setItem") localStorage.setItem(key, content); console.timeEnd("setItem") } catch (err) { console.log("err code:", err.code); console.log("err message:", err.message) }
产生异常,存储失败。至于更多异常详情吗,参见 localstorage_功能检测[4]:
function storageAvailable(type) { var storage; try { storage = window[type]; var x = '__storage_test__'; storage.setItem(x, x); storage.removeItem(x); return true; } catch(e) { return e instanceof DOMException && ( // everything except Firefox e.code === 22 || // Firefox e.code === 1014 || // test name field too, because code might not be present // everything except Firefox e.name === 'QuotaExceededError' || // Firefox e.name === 'NS_ERROR_DOM_QUOTA_REACHED') && // acknowledge QuotaExceededError only if there's something already stored (storage && storage.length !== 0); } }
答案: 占空间
键的数量,对读写的影响
我们500 * 1000
键,如下
let keyCount = 500 * 1000; localStorage.clear(); for (let i = 0; i < keyCount; i++) { localStorage.setItem(i, ""); } setTimeout(() => { console.time("save_cost"); localStorage.setItem("a", "1"); console.timeEnd("save_cost"); }, 2000) setTimeout(() => { console.time("read_cost"); localStorage.getItem("a"); console.timeEnd("read_cost"); }, 2000) // save_cost: 0.05615234375 ms // read_cost: 0.008056640625 ms
你单独执行保存代码:
localStorage.clear(); console.time("save_cost"); localStorage.setItem("a", "1"); console.timeEnd("save_cost"); // save_cost: 0.033203125 ms
可以多次测试, 影响肯定是有的,也仅仅是数倍,不是特别的大。
反过来,如果是保存的值表较大呢?
const charTxt = "a"; const count = 5 * 1024 * 1024 - 1 const val1 = new Array(count).fill(charTxt).join(""); setTimeout(() =>{ localStorage.clear(); console.time("save_cost_1"); localStorage.setItem("a", val1); console.timeEnd("save_cost_1"); },1000) setTimeout(() =>{ localStorage.clear(); console.time("save_cost_2"); localStorage.setItem("a", "a"); console.timeEnd("save_cost_2"); },1000) // save_cost_1: 12.276123046875 ms // save_cost_2: 0.010009765625 ms
可以多测试很多次,单次值的大小对存的性能影响非常大,读取也一样,合情合理之中。
所以尽量不要保存大的值,因为其是同步读取,纯大数据,用indexedDB就好。
答案:键的数量对读取性能有影响,但是不大。值的大小对性能影响更大,不建议保存大的数据。
写个方法统计一个localStorage已使用空间
现代浏览器的精写版本:
function sieOfLS() { return Object.entries(localStorage).map(v => v.join('')).join('').length; }
测试代码:
localStorage.clear(); localStorage.setItem("🔴", 1); localStorage.setItem("🔴🔴🔴🔴🔴🔴🔴🔴", 1111); console.log("size:", sieOfLS()) // 23 // 🔴*9 + 1 *5 = 2*9 + 1*5 = 23
html的协议标准
WHATWG 超文本应用程序技术工作组 的localstorage[5] 协议定了localStorage的方法,属性等等,并没有明确规定其存储空间。也就导致各个浏览器的最大限制不一样。
其并不是ES的标准。
页面的utf-8编码
我们的html页面,经常会出现<meta charset="UTF-8">
。告知浏览器此页面属于什么字符编码格式,下一步浏览器做好解码工作。
<head> <meta charset="UTF-8"> <meta http-equiv="X-UA-Compatible" content="IE=edge"> <meta name="viewport" content="width=device-width, initial-scale=1.0"> <title>容器</title> </head>
这和localStorage的存储没有半毛钱的关系。
localStorage扩容
localStorage的空间是 10M的字节数,一般情况是够用,可是人总是有贪欲。真达到了空间限制,怎么弄?
localStorage扩容就是一个话题。
引用
localStorage[6]
源文:程序员成长指北