由数据库某字段存数组引发的json_encode/serialize思考
导火索场景:
- 原来:mysql中 result表 img字段原存储字符串,内容为某图片链接;
- 现在:该字段需要存储多张图片链接,1-3个元素行程的数组;
google得到的普遍建议有两种: https://stackoverflow.com/questions/3413291/how-to-store-an-array-into-mysql
- 建议一:根据具体场景构建多张表,通过主键外键形成关联。
优点:支持针对数组中某个字段的查询等;缺点:需要结合具体场景
- 建议二:序列化数组,php提供内置方法支持序列化与反序列化(serialize / unserialize)(开发完后发现仍存在另一种序列化方式json_encode / json_decode)
优点:方便实现;缺点:数组被看作整体,不支持对单个元素的操作;
不存在针对单个图片链接的查询等操作,选择建议二。
问题:接口postman img参数一栏值写 [xxx,xxx],序列化后入库,获取时反序列化预期返回数组的出参 [xxx,xxx],实则返回string类型的 "[xxx,xxx]"
排查过程:在php中gettype查看数据类型,入参实则为string类型,json_decode后才为array类型
原因:postman img参数一栏值写 [xxx,xxx],此时其实为string类型,json类型的数组。
后续一:对json类型的了解一直过于肤浅,乘此机会学习之,相关资料让我茅塞顿开,总结分享如下。
1. json可以理解为符合一定书写格式的字符串,实质仍是string;
2. json具体的格式规则可以总结为4句话
3. json只接受utf-8编码的字符,所以json_encode()的参数必须是utf-8编码,否则会得到空字符或者null,
起初看了json的文档,就是被这些规则,[],{}混乱了,但看到下面一段话就通了。来源(阮一峰:数据类型和json格式)
它说,从结构上看,所有的数据(data)最终都可以分解成三种类型:
第一种类型是标量(scalar),也就是一个单独的字符串(string)或数字(numbers),比如"北京"这个单独的词。
第二种类型是序列(sequence),也就是若干个相关的数据按照一定顺序并列在一起,又叫做数组(array)或列表(List),比如"北京,上海"。
第三种类型是映射(mapping),也就是一个名/值对(Name/value),即数据有一个名称,还有一个与之相对应的值,这又称作散列(hash)或字典(dictionary),比如"首都:北京"。
现在,任何的数据类型都可以归并到以上三类中。数组表示有序数据的集合,而对象表示无序数据的集合。如果数据的顺序很重要,就用数组,否则就用对象
而我的[],{}混乱也解决了,[]对应的为序列,也可称为索引数组;{}对应的为映射,也可称为关联数组。来源:阮一峰:在PHP语言中使用json
json_encode和json_decode在第二三种类型上的操作则可理解为string类型和映射或序列之间的转换;对于标量来说,则是进行编码转义(只搜到底层会unicode,具体未找到?)
//序列,索引数组 $arr = Array('one', 'two', 'three'); echo json_encode($arr); //["one","two","three"] //映射,关联数组 $arr = Array('1'=>'one', '2'=>'two', '3'=>'three'); echo json_encode($arr); // {"1":"one","2":"two","3":"three"} //特别说明,映射的decode $json = '{"a":1,"b":2,"c":3,"d":4,"e":5}'; var_dump(json_decode($json)); //默认生成stdClass对象 object(stdClass)#1 (5) { ["a"] => int(1) ["b"] => int(2) ["c"] => int(3) ["d"] => int(4) ["e"] => int(5) } var_dump(json_decode($json,true)); //加参数true,指定生成关联数组 array(5) { ["a"] => int(1) ["b"] => int(2) ["c"] => int(3) ["d"] => int(4) ["e"] => int(5) }
后续二:序列化
何时需要序列化?
复杂数据结构在php脚本执行过程在内存中存储,但不可用于直接传输/存储入库等。
序列化的实质是什么?
数据结构存储会有对应的数据结构,序列化实则可以理解为降维的过程。
json_encode/serialize的区别?
都是序列化生成字符串的过程,采用不同的规则。自我理解,serialize是php 3.05开始支持,生成字符串更为紧凑,json_encode是PHP 5.2之后支持,可读性更好。
更新区别:
JSON vs. Serialized Array in database [closed]
Preferred method to store PHP arrays (json_encode vs serialize)
基本评价是,json的易读性更好、速度更快、序列化后存储空间更小。
只在以下几种情况不选择json:
1. 使用php版本过低,不支持;
2. 需要存储的复杂结构元素过多,超过127个元素,json将返回错误;
3. 需要保留类名等信息