随笔分类 - BigData
Kafka基于docker-compose单结点部署SASL_PLAINTEXT
摘要:Kafka基于docker-compose单结点部署SASL_PLAINTEXT背景Kafka是一个分布式流处理平台,由LinkedIn开发并开源,如今在多个行业中都有广泛的应用。以下是Kafka的当前用途以及行业应用的详细描述: **Kafka的用途**: 1. **消息队列**:Kafka最常见
阅读全文
15个免费数据集-数据科学项目
摘要:15个免费数据集-数据科学项目 如果您曾经参与过个人数据科学项目,那么您可能已经花了很多时间在互联网上搜索有趣的数据集进行分析。 筛选数十个数据集以找到最适合的数据集可能很有趣,但下载和导入多个 CSV 文件也可能令人沮丧,结果发现数据只是丢失,没有那么有趣。 幸运的是,有一些在线存储库可以保存数据
阅读全文
数据分析介绍一
摘要:数据分析是指通过建立审计分析模型对数据进行核对、检查、复算、判断等操作,将被审计单位数据的现实状态与理想状态进行比较,从而发现审计线索,搜集审计证据的过程。数据分析的目的是把隐没在一大批看来杂乱无章的数据中的信息集中、萃取和提炼出来,以找出所研究对象的内在规律。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。数据分析是组织有目的地收集数据、分析数据,使之成为信息的过程。这一过程...
阅读全文
中台MongoDB应用
摘要:中台MongoDB应用目前数据仓库与大数据不足数据中台以打通部门或数据孤岛的统一数据平台为基础,构建统一数据资产体系,并以API服务方式为全渠道业务 分析+应用,提供即时交付能力的企业级数据架构金融行业技术需求技术产品关系型数据库数据仓库大数据NOSQL与非结构数据MongoDb存储的优势,多模数据库对象模型全渠道业务支持触发器API工具集银行案例基于mongodb的数据平台优势今天先到这儿,希望...
阅读全文
Elasticsearch与Hadoop集成大数据处理介绍
摘要:传统大数据处理现代数据架构Hadoop在20业务场景的应用DataLakeA data lake is a system or repository of data stored in its natural format, usually object blobs or files. A data lake is usually a single store of all enterprise ...
阅读全文