摘要: 1.具体的shell命令用法可以通过help或man命令进入手册来查询其具体的用法。2.终端本质上对应着linux上的/dev/tty设备,linux的多用户登录就是通过不同的/dev/tty设备完成的,linux默认提供了6个纯命令行界面的’‘terminal’’(准确的说这里应该是6个虚拟控制台 阅读全文
posted @ 2019-11-18 21:44 玩转大数据 阅读(1680) 评论(0) 推荐(0) 编辑
摘要: 相关性算分 指文档与查询语句间的相关度,通过倒排索引可以获取与查询语句相匹配的文档列表 如何将最符合用户查询需求的文档放到前列呢? 本质问题是一个排序的问题,排序的依据是相关性算分,确定倒排索引哪个文档排在前面 影响相关度算分的参数: A. TF(Term Frequency):词频,即单词在文档中 阅读全文
posted @ 2019-11-18 21:22 玩转大数据 阅读(699) 评论(0) 推荐(0) 编辑
摘要: https://blog.csdn.net/qq_36743482/article/details/78383964 阅读全文
posted @ 2019-11-18 20:00 玩转大数据 阅读(2695) 评论(0) 推荐(0) 编辑
摘要: 常见端口汇总:Hadoop: 50070:HDFS WEB UI端口 8020 : 高可用的HDFS RPC端口 9000 : 非高可用的HDFS RPC端口 8088 : Yarn 的WEB UI 接口 8485 : JournalNode 的RPC端口 8019 : ZKFC端口 19888:j 阅读全文
posted @ 2019-11-18 19:35 玩转大数据 阅读(640) 评论(0) 推荐(0) 编辑
摘要: FS Shell 调用文件系统(FS)Shell命令应使用 bin/hadoop fs <args>的形式。 所有的的FS shell命令使用URI路径作为参数。URI格式是scheme://authority/path。对HDFS文件系统,scheme是hdfs,对本地文件系统,scheme是fi 阅读全文
posted @ 2019-11-18 19:20 玩转大数据 阅读(928) 评论(0) 推荐(0) 编辑