Fork me on GitHub

03 2019 档案

摘要:最近加入一个Spark项目,作为临时的开发人员协助进行开发工作。该项目中不存在测试的概念,开发人员按需求进行编码工作后,直接向生产系统部署,再由需求的提出者在生产系统检验程序运行结果的正确性。在这种原始的工作方式下,产品经理和开发人员总是在生产系统验证自己的需求、代码。可以想见,各种直接交给用户的错 阅读全文
posted @ 2019-03-21 15:13 氢氦 阅读(3627) 评论(0) 推荐(0) 编辑
摘要:测试是软件开发中的基础工作,它经常被数据开发者忽视,但是它很重要。在本文中会展示如何使用Python的uniittest.mock库对一段PySpark代码进行测试。笔者会从数据科学家的视角来进行描述,这意味着本文将不会深入某些软件开发的细节。 本文链接:https://www.cnblogs.co 阅读全文
posted @ 2019-03-11 11:11 氢氦 阅读(2053) 评论(0) 推荐(0) 编辑
摘要:最近被一个库龄报表的需求折腾得不轻,这里整理一下库龄报表相关的概念和资料,希望能有所帮助。 库龄 通俗地说,库龄是指产品在售出前在仓库放置的时间长短。从库存管理的角度来看,对库龄的分析有助于管理人员对物品的存取进行规划,避免物品过期。从会计的角度看,可以根据存货库龄分析对存货周转、呆滞及存货跌价减值 阅读全文
posted @ 2019-03-07 17:01 氢氦 阅读(2702) 评论(0) 推荐(0) 编辑
摘要:如管理学学者彼得·德鲁克所说:你无法管理你不能衡量的东西( If you can't measure it, you can't manage it)。要对已有程序进行性能优化,首先要对它的运行状况做出量化分析。 将代码下推到ABAP CDS,是SAP推荐的一种优化方式。但正因逻辑从应用服务器向数据 阅读全文
posted @ 2019-03-05 09:33 氢氦 阅读(2873) 评论(0) 推荐(0) 编辑