数据分析写作——程序员的另外一种输出
辛苦做了三年的数据分析软件,没人知道我,写了两篇文章,倒引来了大量的关注。
写文章的目的
写文章的理由可能有很多,对我来说,内外扩展交际圈,提高个人知名度的重要手段。对内能锻炼文笔,完善逻辑思维能力,从而能形成完整闭环。只不过写文章对我来说,真没那么轻松,从构思到提笔,到最后的修订,每个步骤都需要大量的耐心和对细节的把握。数据分析文章更是如此,三天完成一篇文章就不错了。
不过,在看到无数人向我发出反馈,对我关注并提意见时,那种感觉相当不错,比打游戏带来快乐的多多了。所以一定要写下去。
读者群体
读者数量多固然很好,但对我的目的来说,质量比数量更重要。也许未来改变我人生的那个人,就是我其中一篇文章的读者。
现在读者培养出了“一眼”看出内容到底是否有价值的能力,也变得越来越没有耐心了 。读者会点击链接,在看第一句话和几张图后,快速决定阅读的策略。最可能快速地下翻,只看观点。也有一部分人,对本文特别感兴趣,就会仔细地阅读。
移动互联网时代,最重要的资源是注意力,不要抱怨读者没有耐心,读者的手指已经投票了。从阅读方式就足以过滤出目标读者。一篇好文章,不怕没人看,就怕写不出来,能成功抓住几万人10分钟的注意力,就已经非常成功了。因此我针对的阅读群体是,IT,信息和金融相关的高素质从业人员。
数据分析的特点
鸡汤文无毒但有害,各类段子浪费时间无营养,养生健康文章满天飞。读者都在渴望真正的干货。数据分析提供了一种手段,避免了夸夸其谈。能从复杂的数据中抽取真正关键的观点和洞见。这种手段是很有吸引力的。针对国计民生,地铁交通,房价,教育,人口变迁,商场分布,可谓受众极广。分析的角度亦可多变,进而得到丰富的结论。
打个比方说,像我的父母辈,会发现面向50岁左右的消费人群的购物商场并不太好找。凯德大悦城针对年轻人,西单燕莎价格高昂。写出一篇中老年人在北京的购物攻略,应该会很有意思。
数据分析的几个层次
我罗列了数据分析的几个层级。
第一维度:排序,过滤,转换。通常用列表形式展现。
第二维度:分组,聚合。通常用直方图,饼状图等展现,也是常规数据分析最常用也最容易理解的方式。
第三维度:关系。 例如聚类,分类,复杂网络。通常需要N平方的计算复杂度。但能提供更高维度的可视化思路。
第四维度:时间序列。改变才是最大的不变,分析随时间变化的参量,尝试发现规律并预测规律。
第五维度:?待补充吧。
不仅是数据,更要观点
数据和真理,本身是无趣的。你需要将其包装上漂亮的外衣。因此仅仅一两句总结的话显然是不够的。你需要告诉读者,为什么是这个样子?它带来了怎样的后果?乃至它周边的段子。新闻式的写作风格并不适合于微信文章。
对其感兴趣的人,必然已有一定的知识储备,若想真正吸引这些读者,就需要比他们站在更高的层级上去看问题。因此写文章前,必须对话题相关的文章进行大量的阅读,形成立体而丰富的观感。如果没有相关知识,很容易给出令专业人员啼笑皆非的结论。
不仅要观点,还要建议
很多读者会有疑问,“我看了这篇文章之后,能对我产生怎样的用处呢?”。例如,房价分析应该给出适合买房的商区位置,购物攻略应推荐物美价廉的商场。地铁分析应该给出换乘的策略。然而,给出合理的建议会更加困难,需要大量的人工分析。
至于预测,我敢吗?现在不敢。
是否需要故事?
写了两篇文章,第一篇只有干巴巴的图表和结论,在当时寥寥无几的关注者情况下 获得了五千的阅读量。第二篇花了我多得多的时间,包装了还算可以的故事来串起整个分析流程,却仅仅有两千的阅读。但身边人反馈给我的是,第二篇更好!那到底第二篇好还是第一篇好呢?我倒是很想针对这类问题做一次分析。然而数据量实在太小,难以成文。
从目前来看,风趣幽默,问题驱动的文章应该是首选。文章少了很多包袱,简单易读,更重要的是好写啊!
我渴望有人与我讨论
在写文章时,我故意不修改一些很明显的错误,期待有人指出来。不幸的是,没有人给我反馈,也许看到的人没时间告诉我吧。有读者会找我进行有趣的线下交流,让我认识了大量的新朋友,并获得了新的机会。
缜密的思维,考虑读者的感受
这是我在写文章中获得的最大收获。我尽可能通过完整的逻辑,将整篇文章串起来,符合问题的分析思考规律。同时尽量考虑读者的感受,他们会喜欢看这一段吗?我该怎么修改?
结语
真正的好文,一眼就能看出来。每一句话都透露着作者的真知灼见,没有一两个礼拜写不出来。我是不是该去主动看看穷经皓首才写成的学术论文呢?我也期待通过写作,能给我带来更多正向的改变。
作者:热情的沙漠
出处:http://www.cnblogs.com/buptzym/
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。