元数据治理利器 - Apache Atlas
摘要:一、功能简介 Atlas 是一组可扩展的核心基础治理服务,使企业能够高效地满足其在 Hadoop 中的合规性要求,并允许与整个企业数据生态系统集成。Apache Atlas 为组织提供开放的元数据管理和治理功能,以构建其数据资产的目录,对这些资产进行分类和治理,并为数据科学家、分析师和数据治理团队提
阅读全文
posted @
2022-08-16 16:51
wzyy
阅读(1648)
推荐(1) 编辑
Atlas启动报错:Caused by: org.apache.solr.common.SolrException: Cannot connect to cluster at xxx.com:2181: cluster not found/not ready
摘要:Atlas启动时报以下错误,看情况是atlas没有在zk上找到solr注册信息;然后发现solr启动命令bin/solr start -force会默认使用内置的zk,不会往公共zk上面注册; 解决方案是solr启动时手动指定一下zk地址即可:bin/solr start -p 8983 -z lo
阅读全文
posted @
2022-08-08 14:11
wzyy
阅读(691)
推荐(0) 编辑
Spark: Cluster Computing with Working Sets
摘要:本文是对spark作者早期论文《Spark: Cluster Computing with Working Sets》做的翻译(主要借助谷歌翻译),文章比较理论,阅读起来稍微有些吃力,但读完之后总算是对spark有了一个初步的认知,对于后续学习使用spark还是很有帮助的。 摘要 MapReduce
阅读全文
posted @
2022-08-01 14:35
wzyy
阅读(805)
推荐(0) 编辑