摘要:
加载 如何利用索引和主存储,是一种两难的选择。 选择不使用索引,只使用主存储:除非查询的字段就是主存储的排序字段,否则就需要顺序扫描整个主存储。 选择使用索引,然后用找到的row id去主存储加载数据:这样会导致很多碎片化的随机读操作。(ES检索出来的一堆ID,然后根据这些ID去数据库里取东西就是碎 阅读全文
posted @ 2017-02-23 11:37
bonelee
阅读(1673)
评论(0)
推荐(0)
摘要:
一般人们谈论时间序列数据库的时候指代的就是这一类存储。按照底层技术不同可以划分为三类。 直接基于文件的简单存储:RRD Tool,Graphite Whisper。这类工具附属于监控告警工具,底层没有一个正规的数据库引擎。只是简单的有一个二进制的文件结构。 基于K/V数据库构建:opentsdb(基 阅读全文
posted @ 2017-02-23 11:12
bonelee
阅读(5043)
评论(1)
推荐(0)
摘要:
在默认情况下,开启_all和_source 这样索引下来,占用空间很大. 根据我们单位的情况,我觉得可以将需要的字段保存在_all中,然后使用IK分词以备查询,其余的字段,则不存储. 并且禁用_source字段.(也可以通过_source includes或者excludes 指定或者排除字段) { 阅读全文
posted @ 2017-02-23 11:02
bonelee
阅读(4445)
评论(0)
推荐(0)
摘要:
Elasticsearch: Five Things I was Doing Wrong Update: Also check out my series on scaling Elasticsearch. I’ve been working with Elasticsearch off and o 阅读全文
posted @ 2017-02-23 10:50
bonelee
阅读(267)
评论(0)
推荐(0)
摘要:
From Elasticsearch's website: The _source field contains the original JSON document body that was passed at index time. The _source field itself is no 阅读全文
posted @ 2017-02-23 10:38
bonelee
阅读(1331)
评论(0)
推荐(0)
摘要:
A sample network anomaly detection project Suppose we wanted to detect network anomalies with the understanding that an anomaly might point to hardwar 阅读全文
posted @ 2017-02-23 09:56
bonelee
阅读(1472)
评论(0)
推荐(0)
摘要:
机器学习起源于神经网络,而深度学习是机器学习的一个快速发展的子领域。最近的一些算法的进步和GPU并行计算的使用,使得基于深度学习的算法可以在围棋和其他的一些实际应用里取得很好的成绩。 时尚产业是深度学习的目标领域之一。闪购网站Gilt就一直在使用深度学习来进行产品推荐和服装的属性分类。裙子样式是通过 阅读全文
posted @ 2017-02-23 09:24
bonelee
阅读(1142)
评论(0)
推荐(0)
摘要:
2017年2月15日,在加利福尼亚州的开源领袖峰会上,由Linux基金会执行董事Jim Zemlin进行的一次采访中,Torvalds讨论了他如何管理Linux内核的开发以及他对工作的态度。 Linus Torvalds认为,科技行业对创新的颂扬是一种自鸣得意,沾沾自喜,以自我为中心。 他更直白地表 阅读全文
posted @ 2017-02-23 09:17
bonelee
阅读(366)
评论(0)
推荐(0)

浙公网安备 33010602011771号