随笔 - 154  文章 - 0  评论 - 18  阅读 - 24万
08 2022 档案
元数据治理利器 - Apache Atlas
摘要:一、功能简介 Atlas 是一组可扩展的核心基础治理服务,使企业能够高效地满足其在 Hadoop 中的合规性要求,并允许与整个企业数据生态系统集成。Apache Atlas 为组织提供开放的元数据管理和治理功能,以构建其数据资产的目录,对这些资产进行分类和治理,并为数据科学家、分析师和数据治理团队提 阅读全文
posted @ 2022-08-16 16:51 wzyy 阅读(1648) 评论(0) 推荐(1) 编辑
Atlas启动报错:Caused by: org.apache.solr.common.SolrException: Cannot connect to cluster at xxx.com:2181: cluster not found/not ready
摘要:Atlas启动时报以下错误,看情况是atlas没有在zk上找到solr注册信息;然后发现solr启动命令bin/solr start -force会默认使用内置的zk,不会往公共zk上面注册; 解决方案是solr启动时手动指定一下zk地址即可:bin/solr start -p 8983 -z lo 阅读全文
posted @ 2022-08-08 14:11 wzyy 阅读(691) 评论(0) 推荐(0) 编辑
Spark: Cluster Computing with Working Sets
摘要:本文是对spark作者早期论文《Spark: Cluster Computing with Working Sets》做的翻译(主要借助谷歌翻译),文章比较理论,阅读起来稍微有些吃力,但读完之后总算是对spark有了一个初步的认知,对于后续学习使用spark还是很有帮助的。 摘要 MapReduce 阅读全文
posted @ 2022-08-01 14:35 wzyy 阅读(805) 评论(1) 推荐(0) 编辑


点击右上角即可分享
微信分享提示