代码改变世界

[小创造]“XENON”,我的JSON变种。

2010-07-27 03:27  Nana's Lich  阅读(2146)  评论(2编辑  收藏  举报

JSON已经成为了现在互联网上轻量级数据传输的事实标准,现在已经很少听说哪个流行的web API不支持JSON了,而很多内部或者专用的应用程序也都在使用JSON来传递数据。

但是在用JSON的过程中,我遇到了一个问题——这个问题想必是大家多少都遇到过,那就是:JSON没有定义日期和时间的传递方式。

尽管在今年3月的一次更新中,json2.js已经增加了对Date函数和ISO-8601式的日期/时间格式,但各种常用的开发工具中对日期的支持还是五花八门、千奇百怪的,完全没有统一。

而且,除了日期/时间以外,个别时候我们还需要一些类或者函数的支持,而这些都是不被JSON所支持的。

 

可能有的人看到这里要问了:既然JSON不支持,那为什么不去用别的数据描述/传输方式呢?

原因是JSON本身就是JavaScript(其参考标准为ECMAScript)的功能子集,任何稍懂JavaScript的人都可以轻松地利用JSON。

 

解析JSON最简单的办法是直接使用eval函数将其作为JavaScript代码来执行,而JSON常常被用在互联网上的不同应用之间传递,所以直接将收到的JSON内容传入eval函数是具有很大的风险的,因此在RFC文档中严格规定了JSON的格式,并且给出了检验其安全性的办法。

而这个检验办法就禁止了函数的运行。

 

总而言之,因为JSON在使用上“偶尔”会有些不方便,所以我就开始动脑筋扩展JSON了。

 

 

在参考了RFC-4627、json2.js以及一些常见的JavaScript语法着色器以后,我发现:虽然json2.js已经有了对日期/时间的支持,但它所采用的语法分析的模式,这就意味着如果不是对语法分析有一定的了解,是很难对它进行扩展的;即使我稍微研习过一些语法分析的知识,想要扩展它也并非很容易的事情,更别谈日后的维护了。

所以我决定用RFC-4627中建议的较为简单的正则表达式过滤法。

 

这个扩展的基本实现是这样的:

        function Xenon(){}
        var protoXenon = Xenon.prototype;
        protoXenon.xeval = function(s){
            var al = [], vl = [], ol = {};
            function $(i, v){
                // i = parseInt(i);
                // return ol[i] || (ol[i] = v);
                return ol.propertyIsEnumerable(i) ? ol[i] : (ol[i] = v);
            }
            for(var n in this)
                if(this.propertyIsEnumerable(n) && typeof this[n] == 'function')
                    al.push(n), vl.push(this[n]);
                
            return eval('0,function(' + al + '){return ' + s + ';}').apply(this, vl);
        };
        protoXenon.safeXeval = function(s){
            var T = this;
            return (!/[^\),:{}\[\]0-9.\-+Eaeflnr-u \n\r\t]/.test(
                s.replace(/"(\\.|[^"\\])*"/g, '')
                .replace(/([^\s:\[,\(]+?)\(/g,function($0, $1){
                    // return T.propertyIsEnumerable($1) ? '' : $1 + '(';
                    return T.propertyIsEnumerable($1) ? '' : '@';
                })) || null) &&
                this.xeval(s);
        };

 

基本用法就是创建一个xenon对象,为其设置新的成员以启用扩展函数。

可以把扩展函数直接添加到xenon对象上,也可以在全局作用域中声明函数再在xenon对象上设置非函数类型的成员值。

例子:

var xenon = new Xenon();
xenon.Array = 0;
xenon.$ = 0;
xenon.date = function(s){return new Date(s);};
var o = xenon.safeXeval('{"list":Array(3,6,9),"created":$(1,date("Tue Jul 27 02:48:03 UTC+0800 2010")),"modified":$(1)}');
print(o.list);
print(o.created);
print(o.modified == o.created);

 

注:这个例子并不能直接作为JScript.NET代码执行,若要在JScript.NET中使用则必须将字符串"unsafe"作为第二个参数传递给eval函数。

注2:function关键字前增加“0,”是为了兼容于IE所使用的JScript引擎——当前的非CLI版本JScript引擎在其eval的实现中并不能正确地理解包围着函数定义的圆括号的意义,会因此引发语法错误。

在这个例子中使用了三个函数扩展:Array为全局作用域中的JavaScript内置函数;$是我在XENON中实现的内置功能,可以在多处引用同一个对象;而date则是对Date构造器的包装。

在XENON的实现中我没有让它支持new操作符创建新对象,我没发现有要用new而不能直接用扩展函数的理由。

 

关于名字:起初打算叫做xJson,但是后来想想觉得有点逊,改作XEON(eXtensible ECMAScript Object Notation)之后又发现好像是Intel的注册商标,所以在中间多加了个N变成了XENON(eXtensible ECMAScript Native Object Notation)。查了下字典,是个化学元素的名字……就这么凑合用吧。

关于安全性:在设计检验方法的过程中我尽可能测试了我所想得到的字符组合,力求避免注入问题。但是由于缺乏实践检验,我也不擅长语法分析之类的事情,所以可能并不是绝对安全。如果谁发现了其中的安全漏洞,可以通知我来改进它。

以后有时间我会做一个简单的从ECMAScript对象向XENON转换的函数;如果真的有很充裕的时间,也许我还会实现包含类名和构造器的转换过程。