摘要: AWK 是一种处理文本文件的语言,是一个强大的文本分析工具。 之所以叫 AWK 是因为其取了三位创始人 Alfred Aho,Peter Weinberger, 和 Brian Kernighan 的 Family Name 的首字符。 语法 awk [选项参数] 'script' var=valu 阅读全文
posted @ 2019-11-19 20:46 玩转大数据 阅读(1272) 评论(0) 推荐(0) 编辑
摘要: 导读: wget是Linux中的一个下载文件的工具,wget是在Linux下开发的开放源代码的软件,作者是Hrvoje Niksic,后来被移植到包括Windows在内的各个平台上。 它用在命令行下。对于Linux用户是必不可少的工具,尤其对于网络管理员,经常要下载一些软件或从远程服务器恢复备份到本 阅读全文
posted @ 2019-11-19 08:56 玩转大数据 阅读(295292) 评论(6) 推荐(37) 编辑
摘要: 路由 当你索引一个文档,它被存储在单独一个主分片上。Elasticsearch 是如何知道文档属于哪个分片的呢?当你创建一个新文档,它是如何知道是应该存储在分片 1 还是分片 2 上的呢? 进程不能是随机的,因为我们将来要检索文档。 算法决定: shard = hash(routing) % num 阅读全文
posted @ 2019-11-19 08:38 玩转大数据 阅读(1447) 评论(0) 推荐(0) 编辑