[转]如何判断一个技术(中间件/库/工具)的靠谱程度?
如何判断一个技术(中间件/库/工具)的靠谱程度?
前段时间周末闲来无事,写了几段小程序。在第三方库上兜了个圈子(悲催地挨个折腾了 pybitcointools,bitcore, libbitcoin, cbitcoin, 挣扎了半天最后又回到pybitcointools),回想起以前看过的 《Game Engine Gems I》的第一篇就是关于这个主题的(“评估和集成中间件的时候应该考虑什么”,"What to Look for When Evaluating Middleware for Integration"),赶紧拿起来翻了翻,顺便总结一下自己的教训,形成文字长点记性。
主观因素
-
首先说明的是,不管承不承认,个人品味对选择的影响非常大。即使是同一个程序员,随着视野的开阔和水平的提高,也会不断地推翻自己以前的品味。例子就不举了,这种非常主观的因素不宜多说,知道有这个重要因素在影响着判断,并随时去提醒自己,在技术和工具的选择上不要有过分的成见,傲慢与偏见,俺认为就可以了。
-
其次,比普通程序员更爱折腾的文艺程序员,往往还有一个困扰——究竟是该用现成的库,还是自己造轮子呢。如果是自己的 pet project,当然无需多言,怎么折腾都行,甚至换个姿势多来几次都无所谓。但是对于稍微大一点的需要多人协作或控制进度的项目来讲,这个问题就难下定论了。项目类型,成员能力分布,成员熟悉程度,对代码的掌控力,对排期的影响,都是不那么直观的软性待考察因素。
-
第三点,很多时候也是最靠谱的一点——朋友的推荐。很多时候我们用一个东西,不是说这个东西有多好,而是那些我们觉得非常靠谱的人(或组织)在用这个东西。这种“安全感”说白了就是一种对他人的经验和判断力的信赖。对创业团队这一点尤其重要,因为跟大公司里按部就班的正规军相比,他们的生存环境要残酷得多,试错机会要少得多。如果不能很好地借力,什么都自己去尝试,风险就会难以控制。
客观因素
说完了这些模糊的,难以度量的主观因素,终于可以说些明确的客观指标了,这也是那篇文章的重点。这里我择要简单说一下,括号里是我加的备注,见谅。
-
集成复杂度。好的中间件的特点是高度模块化(就是说不随便暴露无关的接口),最小侵入(普通的使用不需要你使用继承之类的强耦合关系),容易集成到完全不同类型的代码库(比如尽可能地使用可移植代码而不是直接调用平台API),对外部环境有极少的假定,极力与其他系统的实现细节解耦。设计良好的第三方库应尽可能地具有有效的默认行为,需要最小量的配置就可以工作起来。集成的代码接触面积应该最小化(这个接触面积越大越深入,评估周期和维护工作量就会成倍增长)。如果一个中等水平的程序员做了两天还没让集成能初步跑起来,集成复杂度就值得怀疑了。(需要两天以上时间去集成的库,通常需要n个两天去维护)
(俺认为,配置繁杂、接口凌乱的库,往往意味着作者还没想清楚这个库应该被怎么用,应该用于什么场景,该遮的没遮住,不该露的到处走光,还是很容易识别的) -
内存管理。关心两点:a. 内存占用是否有不合理的开销 b. 内存所有权和分配释放的职责是否清楚。理论上,库的作者应该是对库的内存使用情况最了解的人,他应该定制明确的分配和管理策略。当超出预算时,应该能明确地通知使用者,从而有机会去处理这类事件,而不是任由自己想分多少就分配多少。(更好的设计是把内存使用设计为可伸缩的,这样调用方有机会在运行时根据需要动态去指定内存用量)
如果一个库不能独立管理一个独立堆或内存池,那至少也要把 alloc/free 的接口开放出来。(这样至少可以接管一下,有机会决定转发到系统堆还是定制的堆,以及插入一些统计和调试性的代码)最糟糕的情况是,直接到处随意地 new/delete。这样的话资源的消耗情况就很难控制了。 -
对大量 I/O 访问的处理。硬盘/光盘/网络都是有延迟的,所以访问的策略非常重要。一个第三方库永远不应该直接调用系统API去访问外部资源(如声音文件等),调用方应该有机会去捕获文件和数据的请求,提供定制的方案,从定制的数据源(如已经缓存到内存中的打包数据)读取。最灵活的方式是库完全不提供任何文件或流的读取,只访问给定的内存块,把资源如何获取完全交给调用方开发者处理。最糟糕的中间件,总是假定 POSIX 文件系统在目标平台是有效的,直接依赖C语言运行时的 FILE 和 fopen() 之类的东东。
-
日志系统。设计优良的库能够一致地处理运行时的消息,警告和错误,也很容易集成到你已有的日志系统。更好的设计给你一个选项能从高到低(从完全静默到最少量的关键错误到完全的调试信息)逐级开启各类信息。当开启静默的选项时,编译期就能把这些额外的调试输出字符串干掉,以避免额外的开销。当开启 'Noisy verbosity'之类的选项时,系统的各项指标都不断地被输出,通过某段给定的输出,基本能够了解系统当时运行的上下文细节,一些不当的使用也能被及时捕获。
-
错误处理,稳定性,性能开销,工具。通常评估一个技术,这些都是必须考察的指标,俺就不一一赘述了。
-
客户支持,维护工作量,可移植性等等,这些属于延伸的需求,都很直观,也就略去不提。
最后说一下这里面一条俺认为比较重要的,也是当年带队的MMO项目里,被我列为头条编程规范的原则:绝对,绝对,绝对不要使用没有100%提供源码的第三方技术。这是一条红线,不管这个技术有多强大,都绝对木有例外。程序猿们或多或少都有感触,在编程的世界里,CPU时序的不确定,存储IO的阻塞,其他进程对CPU/内存资源占用造成的扰动,后台进程如杀毒软件偶尔的锁定文件访问,公网路由的拥塞,都为运行着的程序施加了太多不可预知,不可控制的因素。而在这些不可控制的因素里面,允许在自己进程的地址空间内运行一些无法得知其本来面目的代码,是其中最危险也是最容易失控的那一类。反面例子太多,俺就不举了,也免得触物伤怀,影响心境。
基本上主观和客观待考察因素就是这些了,能坚持看到这里,说明您对这个话题确实是感兴趣。为了对得起您的这份耐心,俺特地准备了一点不干不湿的杂货,还请笑纳。
“望,闻,问,切”
在平常的开发活动中,俺总结(山寨)出了“望,闻,问,切”的四字真言,可以用来在一个相对较短的时间里,判断一个技术的适用性。注意,俺说的这些方法,用来鉴别好坏倒还在其次,重点是辨别其是否适用于当下的需求。
“望”
跟传统医学里的驻足远观对方的体态、神态、步态不同,“望”咱们这里取声望口碑之意,也就是间接的评价。上面提过,这里不再细说。总之一句话可以作为底线:“大家都说好的,不一定真的好;大家都说不好的,那基本上好不了。”前半句不解释,后半句是说如果别人都掉到过坑里,那就不要再主动往下跳了。这方面惨痛事例很多,俺也就不举了。
通常这个步骤是不需要花费时间的,一般来源于平日的认识和积累。
“闻”
“闻”可以看作是对其的“第一印象”。正如合格的侦探一眼扫过目标人物就能获取大量的相关信息,训练有素的程序员,从首次了解到某个库的名字和简介,和网站主页面上大致一过,已经可以有一个清晰明确的第一印象了。
俺对一个技术的第一印象通常包括(但不限于):
- (这个技术) 所试图解决的问题是否清晰,明确。
- (这个技术) 所依赖的工具/语言/方法是否可靠,通用。
- Google 搜索第一页的质量情况。(注意,是一整页,不是仅仅官方网站那一条。有时,你会发现除了官方网站,其他条目都是抱怨,那就该“呵呵”了。)
- 网站的响应速度,专业度和品味。
这个步骤通常时间花费在一到两分钟之内。
通过“望”和“闻”一般就可以决定,是不是需要继续深入去 “问” 和 “切” 了。
“问”
- 现在开发是否活跃?上一次更新是在什么时候?
- 有人提交 issue/pull-request 吗?有来自开发者的回复吗?
- 有明确的 branching model 吗?有发布流程吗?是从master分支发布吗?
- 是允许 Fork,还是源码下载,还是只有二进制文件?
- 是否有依赖库?有的话体量有多大,是否为功能所必不可少的?需要单独地维护吗?
- 是否有简明的 build 步骤?build 工具是你常用常维护的吗?
- build 流程能够自动化并整合入你的 CI 服务器吗?
- 对于之前的发布,网站上有汇总的 release note 吗?
- 对于之后的发布,网站上有清晰的 roadmap 吗?
- 针对个人/组织,分别是什么 License?如果 License 不同,对功能是否有影响?
- 信息源(在线文档/教程/作者blog)的质量如何?浮夸吗?样例工程多吗,具体吗?
这些问题虽然看起来略杂乱,但还是能反映一个库的总体质量的,通常五分钟左右就可以有一个基本判断了。
“切”
拿到代码,开始庖丁解牛式地查看,可以称之为“切”。
这个部分其实完全可以独立出一篇文章了——"How to effectively read code",也有一些书是讲这个的,比如 “Code Reading - The Open Source Perspective”之类的,感兴趣的同学可以去翻翻。
题目太大,俺就不展开细说了,只说一个实践之中俺摸索出来的窍门吧:找到这个库最重要的暴露给外部的接口文件(通常是以那个库命名的头文件,如 lua.h,zlib.h 等等),就像读文档一样从头到尾(注意,这个顺序很重要)通读一下。看看自己是否能在没什么阻滞的情况下,基本了解这个库的大部分行为。
优秀的接口设计,读起来行云流水,错落有致,当缓处则缓,当急处则急,信息密度均匀,命名平易近人,符合人的直觉和思维习惯,让人读来不费脑力,心情愉悦;而不良的接口设计,读来往往乱作一团,东拉西扯,前后矛盾,概念冲突,甚至于夹三夹四,啰嗦重复,没头没脑,不知所云,或者有悖常识,命名奇葩,又或卖弄学问,哗众取宠,治经弄典,艰深晦涩,搬弄奇技淫巧,极尽冷僻深奥,令人蹙眉扼腕,基本读不下去,自不必提。
(从上面这段话本身结构上的前后对比里,大家应该能感受到区别了吧,呵呵)
对中小规模的技术而言,上面的“望,闻,问,切”已经足以应付了。而对大型代码库/框架/引擎而言,又有一套不大一样的评估标准,另有曲径可探,咱们择日另行讨论,此处暂且按下不表。
- [2017-03-28] 更新:对大型代码库/框架/引擎的评估见此文:游戏引擎技术点滴
写到这里,本文的内容已经基本完整,可以收尾了。不过结束之前,俺来透露一个小秘密吧(思维敏捷的开发者,可能已经想到了):此文明面上为探讨“如何甄鉴一个技术”,实则另有一层涵义——对于程序库的开发者,这其实也是一份可供参考的对照——如果能对上面的视角,方法和手段了然于心,就可以设计出更好,更易用,更为使用者考虑的系统。
看完了俺的介绍,您有什么独特的方法来评估一个技术是否靠谱呢?欢迎在本文后留言,跟大家一起分享和讨论,一定会有更大的收获 : )
[完]
Gu Lu
[2014-07-28]
[2014-07-29] Update,
下面的评论区有同学提到,
可以通过“看github的star數量以及fork的次數”来了解。
俺的回复:
是的,这是一个可资参考的指标。只是要注意,如果说 fork 的次数还能在某种程度上反映出项目的品质和实用价值的话,那 star 数量通常只反映了一个项目的“流行程度”,而流行的东东往往不一定贴合实际项目的需求。须知流行风向会因时而变,因势而变,到那时再去应变,就比较被动了。
[2014-07-29] Update,
@wingc 同学在微博上提到,
反面例子略过不举,但完全符合客观因素六条的第三方库,正面例子来几个哟?有种现实之中很难找出来的感觉... "绝对,绝对,绝对不要使用没有100%提供源码的第三方技术",此说法未必太武断些。软件大厂的库,哪怕没有源码,一般出问题真的是因为没有仔细看文档自己用错了。
俺的回复:
俺觉得"完全符合"的项目,数量上是趋近于零的。通常来讲,技术由于适用面的不同,都会在某种程度上有所折衷。我还是那句话,我们的目标不是寻找最好的,而是通过对这些因素的考察,找到综合来说最适合自己需求的。
设计优良的库,还是不少的,比如俺曾在 blog 上介绍过的 zmq/nanomsg ,但是正如俺开头所说,这玩意受主观影响过大,说多了容易无端被喷,所以先这样吧,日后慢慢介绍不迟。
此外,关于“三个绝对”的问题,俺专门补充说明一下,
-
如果所谓的“软件大厂”是第一方,那通常咱们也没啥选择。就比如要在 Windows 上开发 3D 游戏,用闭源的 DirectX 也是理所当然。正如文中所说,所谓“三个绝对”是针对那些几乎总是有得选择的第三方库而言的。
-
使用软件大厂的闭源技术,也会带来不小的潜在隐患。大公司通常是不太搭理小团队的,如果你掉进的坑恰好在朋友圈里和网上找不到类似的案例或方案,那尝试跟所谓“软件大厂”交流或反馈一般都是做无用功。最终要么花更多的时间吭哧吭哧workaround,要么去掉对应模块了事。
-
作为程序员,当遇到问题时,你希望的是 a) 通过一路在源码中前后追溯,在解决问题之余,弄清楚前因后果,实实在在地增加自己相关领域的经验和认识呢,还是 b) 对着文档反复猜测和校验自己哪个参数有没有误传?
其实到了关键时刻,有代码在手上,就是一颗定心丸,正所谓“源码之前,了无疑惑”。当遇上奇怪的症状时,什么文档都比不上正在运行着的唾手可得的鲜活的代码。