bonelee - 博客园

2017年2月23日

时间序列数据库——索引用ES、聚合分析时加载数据用什么？docvalues的列存储貌似更优优势一些

摘要：加载如何利用索引和主存储，是一种两难的选择。选择不使用索引，只使用主存储：除非查询的字段就是主存储的排序字段，否则就需要顺序扫描整个主存储。选择使用索引，然后用找到的row id去主存储加载数据：这样会导致很多碎片化的随机读操作。（ES检索出来的一堆ID，然后根据这些ID去数据库里取东西就是碎阅读全文

posted @ 2017-02-23 11:37 bonelee 阅读(1674) 评论(0) 推荐(0)

时间序列数据库概览——基于文件（RRD）、K/V数据库（influxDB）、关系型数据库

摘要：一般人们谈论时间序列数据库的时候指代的就是这一类存储。按照底层技术不同可以划分为三类。直接基于文件的简单存储：RRD Tool，Graphite Whisper。这类工具附属于监控告警工具，底层没有一个正规的数据库引擎。只是简单的有一个二进制的文件结构。基于K/V数据库构建：opentsdb（基阅读全文

posted @ 2017-02-23 11:12 bonelee 阅读(5043) 评论(1) 推荐(0)

ES索引瘦身禁用_source后需要设置field store才能获取数据否则无法显示搜索结果

摘要：在默认情况下,开启_all和_source 这样索引下来,占用空间很大. 根据我们单位的情况，我觉得可以将需要的字段保存在_all中,然后使用IK分词以备查询,其余的字段,则不存储. 并且禁用_source字段.(也可以通过_source includes或者excludes 指定或者排除字段) { 阅读全文

posted @ 2017-02-23 11:02 bonelee 阅读(4445) 评论(0) 推荐(0)

Elasticsearch: Five Things I was Doing Wrong

摘要： Elasticsearch: Five Things I was Doing Wrong Update: Also check out my series on scaling Elasticsearch. I’ve been working with Elasticsearch off and o 阅读全文

posted @ 2017-02-23 10:50 bonelee 阅读(267) 评论(0) 推荐(0)

ES禁用_source不会影响聚合

摘要： From Elasticsearch's website: The _source field contains the original JSON document body that was passed at index time. The _source field itself is no 阅读全文

posted @ 2017-02-23 10:38 bonelee 阅读(1331) 评论(0) 推荐(0)

Anomaly Detection for Time Series Data with Deep Learning——本质分类正常和异常的行为，对于检测异常行为，采用预测正常行为方式来做

摘要： A sample network anomaly detection project Suppose we wanted to detect network anomalies with the understanding that an anomaly might point to hardwar 阅读全文

posted @ 2017-02-23 09:56 bonelee 阅读(1472) 评论(0) 推荐(0)

深度学习在gilt应用——用图像相似性搜索引擎来商品推荐和服务属性分类

摘要：机器学习起源于神经网络，而深度学习是机器学习的一个快速发展的子领域。最近的一些算法的进步和GPU并行计算的使用，使得基于深度学习的算法可以在围棋和其他的一些实际应用里取得很好的成绩。时尚产业是深度学习的目标领域之一。闪购网站Gilt就一直在使用深度学习来进行产品推荐和服装的属性分类。裙子样式是通过阅读全文

posted @ 2017-02-23 09:24 bonelee 阅读(1142) 评论(0) 推荐(0)

Linus Torvalds: 成功的项目源于99%的汗水与1%的创新

摘要： 2017年2月15日，在加利福尼亚州的开源领袖峰会上，由Linux基金会执行董事Jim Zemlin进行的一次采访中，Torvalds讨论了他如何管理Linux内核的开发以及他对工作的态度。 Linus Torvalds认为，科技行业对创新的颂扬是一种自鸣得意，沾沾自喜，以自我为中心。他更直白地表阅读全文

posted @ 2017-02-23 09:17 bonelee 阅读(366) 评论(0) 推荐(0)

2017年2月22日

redis实现分布式锁——核心 setx+pipe watch监控key变化-事务

摘要：如何设计一把分布式锁我们用 redis 来实现这把分布式的锁，redis 速度快、支持事务、可持久化的特点非常适合创建分布式锁。分布式环境中如何消除网络延迟对锁获取的影响锁，简单来说就是存于 redis 中一个唯一的 key。一般而言，redis 用 set 命令来完成一个 key 的设置(加阅读全文

posted @ 2017-02-22 20:22 bonelee 阅读(2834) 评论(0) 推荐(0)

分布式锁的实现方式——ACID数据库、缓存或者是zk

摘要：针对分布式锁的实现，目前比较常用的有以下几种方案：基于数据库实现分布式锁基于缓存（redis，memcached，tair）实现分布式锁基于Zookeeper实现分布式锁在分析这几种实现方案之前我们先来想一下，我们需要的分布式锁应该是怎么样的？（这里以方法锁为例，资源锁同理）可以保证在分布阅读全文

posted @ 2017-02-22 20:12 bonelee 阅读(1431) 评论(1) 推荐(0)

将者，智、信、仁、勇、严也。

Hi，我是李智华，华为-安全AI算法专家，欢迎来到安全攻防对抗的有趣世界。

公告