哪有什么岁月静好,不过是有人替你负重前行!

随笔分类 -  自然语言处理

摘要:Anaconda(官方网站)就是可以便捷获取包且对包能够进行管理,同时对环境可以统一管理的发行版本。Anaconda包含了conda、Python在内的超过180个科学包及其依赖项。 事实上Anaconda 和 Jupyter notebook已成为数据分析的标准环境。 一、什么是Anaconda? 阅读全文
posted @ 2019-09-03 14:51 迎风而来 阅读(51255) 评论(2) 推荐(13) 编辑
摘要:架构挑战 1、对现有数据库管理技术的挑战。 2、经典数据库技术并没有考虑数据的多类别(variety)、SQL(结构化数据查询语言),在设计的一开始是没有考虑到非结构化数据的存储问题。 3、实时性技术的挑战:一般而言,传统数据仓库系统,BI应用,对处理时间的要求并不高。因此这类应用通过建模,运行1- 阅读全文
posted @ 2019-03-25 11:20 迎风而来 阅读(8969) 评论(0) 推荐(2) 编辑
摘要:ETL是英文Extract-Transform-Load 的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。常见于数据仓库开发中将数据由业务系统归集到数据仓库(DW)或者数据集市的过程。在ETL三个部分中,花费时间最长的是“T”(T 阅读全文
posted @ 2019-03-25 11:03 迎风而来 阅读(9692) 评论(0) 推荐(5) 编辑
摘要:一 什么是 ElasticSearch Elasticsearch 是一个分布式可扩展的实时搜索和分析引擎,一个建立在全文搜索引擎 Apache Lucene(TM) 基础上的搜索引擎.当然 Elasticsearch 并不仅仅是 Lucene 那么简单,它不仅包括了全文搜索功能,还可以进行以下工作 阅读全文
posted @ 2019-03-25 09:13 迎风而来 阅读(325) 评论(0) 推荐(1) 编辑

/*吸附球*/
点击右上角即可分享
微信分享提示

喜欢请打赏

扫描二维码打赏

了解更多