摘要: 1、上图 2、存入数据筛选 假如你向这台机器写入了300G的数据,那么就有270G左右的数据再磁盘。 比如es存储要1T,那么你的多台机器留给os cache的内存总和要有512G以上。 所以对存储在es中的数据进行筛选,比如就写入es id,name,age,然后其他的数据存储再hbase或者my 阅读全文
posted @ 2020-08-17 22:47 TPL 阅读(365) 评论(0) 推荐(0) 编辑
摘要: 1、直接上架构图 2、前情提要 底层 lucene :lucene 就是一个 jar 包,里面包含了封装好的各种建立倒排索引的算法代码 倒排索引:在搜索引擎中,每个文档都有一个对应的文档 ID,文档内容被表示为一系列关键词的集合。倒排索引就是关键词到文档 ID 的映射,每个关键词都对应着一系列的文件 阅读全文
posted @ 2020-08-17 22:02 TPL 阅读(966) 评论(0) 推荐(0) 编辑
摘要: 1、构造方法 corePoolSize : 核心线程数 maximumPoolSize : 最大线程数量 keepAliveTime : 空闲存活时间 unit :时间单位 workQueue :阻塞队列,用来存储等待执行的任务。 ArrayBlockingQueue:数组有界队列,先进先出 Del 阅读全文
posted @ 2020-08-17 16:07 TPL 阅读(84) 评论(0) 推荐(0) 编辑