摘要: ▌使用 pathlib 模块来更好地处理路径 pathlib 是 Python 3默认的用于处理数据路径的模块,它能够帮助我们避免使用大量的 os.path.joins语句: 1 2 3 4 5 6 7 8 向左滑动查看完整代码 在Python2中,我们需要通过级联字符串的形成来实现路径的拼接。而现 阅读全文
posted @ 2018-01-31 16:17 KévinX 阅读(1601) 评论(0) 推荐(0) 编辑
摘要: 在计算机科学,信息论中这五大算法体现的思想都是一些常用的核心思想,几乎所有算法都是基于这几类算法的思想上具体实现的,它们也是一种总结归纳吧。 分治算法 一、基本概念 在计算机科学中,分治法是一种很重要的算法。字面上的解释是“分而治之”,就是把一个复杂的问题分成两个或更多的相同或相似的子问题,再把子问 阅读全文
posted @ 2018-01-31 14:45 KévinX 阅读(307) 评论(0) 推荐(0) 编辑
摘要: ETL是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程,目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据。 ETL是BI项目重要的一个环节。 通常情况下,在BI项目中ETL会花掉整个项目至少1/3的时间,ETL设计的好坏直接关接到BI项目的成败。 ETL的 阅读全文
posted @ 2018-01-31 10:12 KévinX 阅读(5043) 评论(0) 推荐(0) 编辑