Lily-一个埋点管理工具
本文来自网易云社区
前言
在很多项目中,埋点数据使用表格来统计的,随着项目的进行,数据量越来越复杂,越来越难以维护。所以很多公司都已经开发了一整套系统,从埋点的录入到代码的输出。
我们项目中iOS和Android双方的埋点内容由于沟通以及一些原因,也没有完全统一,增加了很多沟通成本,为了规范化和统一化,我们也需要这样一个类似的系统。但是很多时候一套系统对于一个小项目来说太过于复杂了,所以这里我做了一个轻量级的本地管理客户端。https://github.com/djs66256/lily
功能简介
启动
由于我们实现的是一套本地管理的系统,所以我把程序系统和数据分开了,所以启动的时候需要选择对应的数据目录,比如本项目目录下的/demo-data/,以微信为例。关于目录下文件功能格式会在之后说明。
主界面
启动之后,我们可以看到我们的埋点数据界面,这里我根据我们的需求把数据分为3类:
事件-数据点
页面
具体参数
数据点包含所有埋点信息,参数是由参数列表选择,可以查看历史和进行编辑。
页面包含了我们的所有页面id,因为一个普通的App拥有的页面不会有太多,所以页面的分级可以少一点。
参数包含了我们埋点过程中所有遇到的参数,考虑到我们项目中所涉及到的参数比较统一,所以就没有进行分类
每行数据的每次改动都会形成一条记录保存在本地,这样我们就可以追溯历史变更了。这里还把所有参数都列了出来,而不是主页面精简后的了。由于性能问题,这里暂时只显示了最近50条记录。
以上所有列表的数据项都是动态可配的。在设计之初,考虑到数据内容可能会根据需要动态调整,所以把所有内容都设计为动态可配的了,又为了在磁盘上的数据的可读性,把所有数据都采用文本json保存,这样也兼容了动态的数据,具体实现后面会详细讲解。
当选择了一个目录后,点击导航栏的创建可以创建一条新的数据,数据格式内容根据根目录属性配置。
点击一行列表后的编辑按钮进入编辑页面,每次保存都会产生一条修改记录。
可选的参数为在根目录为参数内的所有内容,这样设计的原因是为了未来可能对埋点数据的自动化验证,从而需要一个格式化的参数列表,而不是一段文字描述。
为了可以对埋点的整理归类,所以做了简单的搜索功能,可搜索字段也是根据事件目录的配置。
所有搜索字段都是使用正则表达式完成,所以如果需要更复杂精确的匹配,这里也可以输入一段正则来匹配。
点击编译,会把所有事件和页面数据自动生成一份代码,这里是根据需要定制的,所以我只做了iOS的一个样例格式。这里我们从老数据转化过来的时候有重复埋点,所以在转化的逻辑中加入了去重,关于自定义和接入编译系统之后会详细描述。
进阶--配置参数
以demo-data数据配置为例。
数据分类
在所有的数据中,概念都是节点Node,根据功能分为两类:
目录节点DirNode,负责分级和归类。
数据节点StatNode,负责记录每个数据的具体内容。
文件持久化实现
所有数据持久化通过json格式保存为文本文件,所以可以直接查看文件内容。
按照层级结构创建一样的目录层级结构,每个DirNode下面都有一个config.json文件,包含该节点信息。
在最底层每个StatNode会产生一个目录,目录下会根据历史生成1.json,2.json,3.json名字依次递增的文件,保存每次修改后的数据。这里目录名字使用id来命名是为了解决数据埋点id可能存在重名的问题。
只能在目录的最底层可以创建数据,这是为了解决展示时候的难以同时展示数据和目录的问题。
文件持久化格式
每个文件中都需要具备一些基础属性:
name外部显示的名字,对于目录节点则是目录名字
id要求唯一的id,由于DirNode个数比较少,而且固定,所以没有设计创建的功能,自己修改时需要保证唯一。数据节点则会生成一个MD5来填充。
isDirectory表示是否是DirNode
目录节点格式
包含一个columns数组,这是一个非常重要的配置,除了基础属性,所有StatNode里的数据项都是根据该字段动态生成。
这里是一个事件节点例子:
[
{
"type": "text", // 字段类型(暂时只支持text和param)
"required": false, // 是否必填
"title": "描述", // 展示的列名
"key": "description", // 对应于json中的key值
"visible": true, // 在主界面是否隐藏
"editable": true, // 是否可编辑,在编辑和创建界面是否可见
"searchable": true // 是否可以作为搜索参数,影响搜索界面 },
{
"type": "params",
"paramsKey": "params", // 如果是param类型,需要指定`DirNode`的id
"required": false,
"title": "参数",
"dataIndex": "params",
"key": "params",
"visible": true,
"editable": true,
"searchable": false
}
]
可以动态增加或者修改数据项,这样会非常灵活而且可以不通过修改代码就配置数据内容。
节点间的columns是可以被继承的,也就是说子目录的columns必定包含父目录的所有数据内容。可惜目前的使用场景并没有这个要求。
所有其他目录的配置都是类似的。
数据节点格式
同样看一个例子
{
"name": "点赞",
"statId": "onPraise",
"description": "包括3D touch页面",
"version_iOS": "1.0",
"version_Android": "1.1",
"createTime": "2017-04-03T12:22:38.372Z",
"params": [
{
"name": "用户ID",
"description": "",
"createTime": "2017-04-03T11:59:13.467Z",
"isDirectory": false,
"id": "814db1c837ac436ebb569d3554b51fb1",
"paramId": "userId"
},
{
"name": "朋友圈状态",
"createTime": "2017-04-03T12:14:06.676Z",
"isDirectory": false,
"id": "866982e498224b15aa4602f2893f7995",
"paramId": "timelineId"
}
],
"isDirectory": false,
"id": "9b538d5bee1c40ed979e5a38143a9829"}
所有数据都是根据上述配置生成,其中param比较特殊,是把选择的数据节点直接拷贝了一份,这样做的原因是怕其他地方修改或者删除了导致数据不一致的问题,这样做更符合埋点这个需求。
接入编译系统
目前编译系统还是做在了代码中,由于系统本身是有NodeJS实现的,所以要动态配置编译系统还是非常简单的。
编译系统比较开放,这样可以开放更多的功能,但同时也引入了数据风险,之后需要改进下,让编译系统可以动态接入,并且屏蔽内部数据和编译系统的直接联系。
目前代码放在/script目录下。
开发者
这里对整个系统的代码逻辑进行说明。
设计理念
最基本的功能,需要能够在团队内共享数据,其中最方便的就是利用git系统了,所以在每次修改数据的时候除了本地持久化以外,会自动同步git上的数据文件,这也是为什么要数据分离的一个原因。
如果能够接上埋点系统,那么可以通过该系统去分析结果,这个工作量可能会比较大,是一个设想。
如果能够接上自动化测试或者设备,就能够验证埋点数据是否正确,这个的工作量也可能会比较大。
目前完成了最基础的管理埋点和生成代码功能。
运行环境
nodejs
Mac可以通过brew install nodejs来安装
需要electron和webpack
npm install -g electron webpack
运行代码
首先npm install
然后需要链接本地库
cd dd-statnpm linkcd ../statnpm link dd-stat
最后
npm run dev #开启webpack -wnpm run app #启动应用
代码简介
dd-stat是系统的数据层,包含了数据结构和持久化。
stat是界面层,为了实现简单,目前所有逻辑都是在渲染层做的,因为我们的数据量按照我们的需求是不太可能达到如此大的数目,是不太可能出现性能问题的。
stat依赖支付宝的ant design框架来搭建,最初是用redux来组织(/lib),后来发现太过于复杂,应用本身就是个简单的场景,所以后来改为react-router来组织(/lib2)。
/script是数据编译的代码,是导出编译后代码或者导出其他格式的一个出口,可以根据需要扩展。
TODO
git接入
最初的想法是让程序来自动同步git,因为应用的使用场景比较简单,不太可能出现多人同时编辑同一个数据的问题,所以让程序来自动同步数据是最好的,由于时间问题,暂时没有加入。
编译系统完善
现在编译系统是和应用代码捆绑在一起的,最好能够脱离代码,并且可以动态配置编译模板。
更多可配的数据类型
增加对bool,枚举单选,枚举多选,时间等的支持,项目暂时还没有这样的需求。
网易云新用户大礼包:https://www.163yun.com/gift
本文来自网易云社区,经作者段家顺授权发布。