实时数据融合之道:博观约取,价值驱动
陈雷 | DataPipeline 合伙人 & CPO
曾任 IBM 大中华区认知物联网实验室服务部首席数据科学家、资深顾问经理。十年管理经验,十五年数据科学领域与金融领域经验。综合交通大数据应用技术国家工程实验室产业创新部主任,西安交通大学软件学院大数据智能创新中心主任,中国电子学会区块链专委会委员。
所谓数据时效性的提升指的绝不仅仅是用户行为数据、交易数据等时序数据的时效性,或者说这些数据的时效性本身都是很高的,数据时效性提升的主要战场应该是针对散落在各业务系统中没有被集中管理的各类结构化数据以及需要汇聚关联各个业务数据后加工计算的数据(说人话:没有纳入主数据系统管理的各业务系统账户、客户数据及数据仓库、集市中的分析加工结果数据的时效性一般都比较低)。
近年来随着互联网企业在数据技术发展过程中逐渐占据主导地位,互联网数据、用户行为数据等大数据概念被大家普遍接受,但对于企业来说与其把目光盯在价值密度较低的沙子上筛来筛去,不如好好想想自己家里的金山钻石矿里的数据能不能更快地变现(说人话:客户在网银上的访问轨迹的价值远不如客户账户大额变动来的有价值,所以先想办法把这事告诉客户经理吧)。
当然并不是说外部数据没价值或者说时效性不重要,而是说要全面考虑企业域、产业域、生态域可利用的数据,基于实际价值驱动,由高到低提升数据时效性,而不是按照数据本身的时效性来加以利用,舍本逐末,忘记了数据时效性提升的根本目的是为了业务价值(说人话:业务系统里的数据实时获取是比互联网数据获取困难,面临的问题多,可是价值也高呀,你得挑值钱的活干,不能挑好干的活干呀)。
当然,价值在不同层次和不同维度上的理解和定位是不一样的,但在实时数据价值释放过程中,大家需要注意,虽然管理层需要实时了解经营管理信息,但这意味着各业务部门需要改变流程甚至结算的体系。这所面临的困难远不止于技术层面。尽管可以得到自上而下的强力推动,但具体工作却始于一线。在企业层面没有对实时数据的应用达成基本共识之前,实时数据在经营管理类场景中的应用尤为慎重,不要让自己陷入到对于数据口径、数据质量、数据准确性的权责陷阱中,实时数据更好的切入点是直接与收入相关的触客业务,无论是基于账户变化的事件营销抑或是协助客户经理的实时画像,这也很科学,管理层要的是运筹帷幄,失之毫厘谬以千里,一线要的是炮弹,销售线索本来就是用来验证的(说人话:你会发现客户和基层营销人员对帮助他们的工具的容忍度要远远高于你的领导)。
综上,实时数据既要全面覆盖能被利用的各类数据,也要基于价值分清先后顺序;既要高效释放数据价值,也要选好抓手、切入点;所谓博观约取,价值驱动。
——确实可以,不过领导,咱们这个可是触客业务,这么做稳吗?
——稳不稳的咱们往下看。
我们将在下一期的“实时数据融合之法:稳定高容错”中详细阐释实时数据融合如何做才能应对各种不稳定带来的不确定性,敬请期待!