告别硬编码,mysql 如何实现按某字段的不同取值进行统计

上周我突然意识到,我在grafana上写的 sql 语句存在多处硬编码。这篇笔记将记录如何实现没有硬编码的sql语句,以及自学编程过程中如何应对自己的笨拙代码和难题不断的状况。

1、有效但粗笨的硬编码

所谓硬编码,大意是指代码中出现很多具体的取值,每个取值都是手动赋值的。比如:

-- 达成某个成就的用户数
select
    count(user_id) as 用户数
from 
    achivement_table
where
    achivement_name= '牛刀小试'

以我家产品 xue.cn 的成就系统为例,我们首个版本仅有10个成就,我要拷贝粘贴修改成就名称达10次。最近成就升级到V2版本,有17个成就,未来还会有更多成就。再比如习题和章节,每本书的章节数和习题数,都是几十个起。至于统计每本书的阅读用户数,每个章节的留言数,每个成就的达成用户数……这类实现太频繁了。

如果全部采用硬编码,我意识到这将低效粗笨。

在初学编程时,你我总会写出一些低效但生效的代码。随着编程水平提升或需求变得复杂,我们将有机会迭代自己的代码。迭代是好事,但这不意味着之前的低效但有效的代码是坏事。——接纳自己早期的笨拙,并追求持续的进步。咱们不需要为自己初学阶段的代码感到不好意思或羞愧,而是要视之为提升的机会。这个心态令我在自学编程的路上几乎无所畏惧。

2、知道,但用时忘

如何实现代码自动获取每个取值,并按该值分别统计呢?我搜索到一些代码,却看不懂:

image

不得已,我准备好问题描述,并发红包在编程学习群里请教。群友给出的答案让我哭笑不得:

特么这方法我不是会吗!?鬼打墙啦。

这种现象在初学技能时,是不是挺常见的!?知道,但不熟练。知道知识点,但实战时可能想不起来。或者知道某一种实战情境,换到其它实战情境就忘了……嗯,本质上还是重复的不够,熟练度不行啊。

image

既然是我已知的知识点,立即实操吧。

情境A:字段取值范围在同一表格

想要统计的原数据,和该字段的所有取值范围,在同一张数据表时,代码简单如下。

-- 所有成就的完成用户数
select
    achivement_name as 成就名称,
    count(user_id) as 用户数
from 
    achivement_table
group by
    成就名称
order by
    成就名称

情境B:字段取值范围在另一表格

想要统计的原数据,和该字段的所有取值范围,不在同一张数据表时,代码仅稍微复杂一点点。

-- 所有成就的完成用户数
select
    achivements.name as 成就名称,
    count(achivement_event.user_id) as 用户数
from 
    achivement_event,achivements
where
    achivement_event.name = achivements.name
group by
    成就名称
order by
    成就名称

3、解决一个难题,新的困惑到来

硬编码的问题现在倒是解决了,但实现数据可视化时,又有新的情况产生。

之前的硬编码风格,在 grafana 上通过 add query 完成,该操作是新增数据列,使得数据结果是一行多列,每个成就名就是一列。

image

image

这种数据,用 grafanabar gauge 图表类型展示效果很不错。

image

之后没有硬编码的sql语句,得到的数据结果是多行2列,首列是成就名,次列是用户数。相当于之前数据结果的倒置。

行列倒置在 python pandas中,就是对dataframe数据一个T操作而已。但在 grafana 上如何灵活地操作行列,我还有不少困惑要解决。——这并非我的不足,这是我将要提升的机会,对不?

小结

在这篇笔记中,我不仅记录了自己如何完成按某个字段的取值范围进行统计的需求,既有早期的硬编码风格,也有升级版的语句。我还分享了自己如何看待初学编程时的笨拙代码,如何应对一个难题接着一个难题的编程自学过程。希望我的笔记,带给你启发和力量。

posted on 2019-10-24 21:31  刘娟娟PRESSone  阅读(551)  评论(0编辑  收藏  举报