12 2016 档案
摘要:Features Column-oriented time-series database. Log-structured append-only B+tree with multiversion concurrency control. Crash safety. Fast aggregation
阅读全文
摘要:先看下 http://www.cnblogs.com/bonelee/p/6236962.html 这里对于环形数据库的介绍,便于理解归档这个操作! 转自:http://blog.sina.com.cn/s/blog_6de3aa8a0102wk0y.html 早期的OpenStack监控(遥测)项
阅读全文
摘要:原文链接:http://www.jianshu.com/p/0bafd0168647 OpenTSDB介绍 1.1、OpenTSDB是什么?主要用途是什么? 官方文档这样描述:OpenTSDB is a distributed, scalable Time Series Database (TSDB
阅读全文
摘要:转自:http://www.jianshu.com/p/b925b1584ab2 RRDTool 是一套监测工具,可用于存储和展示被监测对象随时间的变化情况。比如,我们在 Windows 电脑上常见的内存和 CPU 使用情况。 RRD 全称是 Round Robin Database ,即「环型数据
阅读全文
摘要:转自:http://suanfazu.com/t/caffe/281 Caffe是一个清晰而高效的深度学习框架,其作者是博士毕业于UC Berkeley的贾扬清,目前在Google工作。 Caffe是纯粹的C++/CUDA架构,支持命令行、Python和MATLAB接口;可以在CPU和GPU直接无缝
阅读全文
摘要:lmdb简介 lmdb是openLDAP项目开发的嵌入式(作为一个库嵌入到宿主程序)存储引擎。其主要特性有: 基于文件映射IO(mmap) 基于B+树的key-value接口 基于MVCC(Multi Version Concurrent Control)的事务处理 类bdb(berkeley db
阅读全文
摘要:influxdb influxdb是最新的一个时间序列数据库,最新一两年才产生,但已经拥有极高的人气。influxdb 是用Go写的,0.9版本的influxdb对于之前会有很大的改变,后端存储有LevelDB换成了BoltDB,读写的API也是有了很大的变化,也将支持集群化,continuous
阅读全文
摘要:时序列数据库武斗大会之什么是TSDB 由于工作上的关系,最近看了一些关于时序列数据库的东西,当然,我所看的也都是以开源方案为主。 趁着这股热劲还没退,希望能整理一些资料出来。如果正好你也有这方面的需求,那么希望这一系列的介绍能够帮助到你。 1. 什么是时序列数据库(Time series datab
阅读全文
摘要:转自:http://blog.csdn.net/ransom0512/article/details/50440316 简介 VoltDB数据库是一个分布式,可扩展,shared-nothing的内存数据库。使用Java 写的存储过程来定义事务。使用标准SQL访问数据,使用并行的单线程处理方式确保数
阅读全文
摘要:转自:http://0351slc.com/portal.php?mod=view&aid=12 近期网络上呈现了有关catena、benchmarking boltdb等时刻序列存储办法的介绍,Go社区也有相似的谈论论题,呈现了seriesly、influxDB、prometheus等优异项目。原
阅读全文
摘要:re.split("(\D)", "2+3-1")
['2', '+', '3', '-', '1']
阅读全文
摘要:一、简介 syslog是Linux系统默认的日志守护进程。默认的主配置文件和辅助配置文件分别是/etc/syslog.conf和/etc/sysconfig/syslog文件。通常,syslog 接受来自系统的各种功能的信息,每个信息都包括重要级。/etc/syslog.conf 文件通知 sysl
阅读全文
摘要:术语: Event :Events are records of activity in log files, stored in Splunk indexes. 简单说,处理的日志或话单中中一行记录就是一个Event;Source type: 来源类型,identifies the format
阅读全文
摘要:摘自:http://www.infoq.com/cn/articles/how-to-build-a-distributed-database?utm_campaign=rightbar_v2&utm_source=infoq&utm_medium=articles_link&utm_content
阅读全文
摘要:时间序列数据库最多,使用也最广泛。一般人们谈论时间序列数据库的时候指代的就是这一类存储。按照底层技术不同可以划分为三类。 直接基于文件的简单存储:RRD Tool,Graphite Whisper。这类工具附属于监控告警工具,底层没有一个正规的数据库引擎。只是简单的有一个二进制的文件结构。 基于K/
阅读全文
摘要:如何联合索引查询? 所以给定查询过滤条件 age=18 的过程就是先从term index找到18在term dictionary的大概位置,然后再从term dictionary里精确地找到18这个term,然后得到一个posting list或者一个指向posting list位置的指针。然后再
阅读全文
摘要:参考: http://www.slideshare.net/lucenerevolution/what-is-inaluceneagrandfinal http://www.slideshare.net/jpountz/how-does-lucene-store-your-data http://w
阅读全文
摘要:转自:http://www.cnblogs.com/LBSer/p/4119841.html 1 lucene字典 使用lucene进行查询不可避免都会使用到其提供的字典功能,即根据给定的term找到该term所对应的倒排文档id列表等信息。实际上lucene索引文件后缀名为tim和tip的文件实现
阅读全文
摘要:转自:http://blog.csdn.net/whuqin 本文介绍下lucene生成的索引有哪些文件组成,每个文件包含了什么信息。基于Lucene 4.10.0。 数据结构 索引(index)包含了存储的文档(document)正排、倒排信息,用于文本搜索。索引又分为多个段(segments),
阅读全文
摘要:摘自:http://blog.codinglabs.org/articles/theory-of-mysql-index.html 在MySQL中,索引属于存储引擎级别的概念,不同存储引擎对索引的实现方式是不同的,本文主要讨论MyISAM和InnoDB两个存储引擎的索引实现方式。 MyISAM索引实
阅读全文
摘要:转自:http://www.cnblogs.com/yangecnu/p/Introduce-B-Tree-and-B-Plus-Tree.html 定义 B 树可以看作是对2-3查找树的一种扩展,即他允许每个节点有M-1个子节点。 根节点至少有两个子节点 每个节点有M-1个key,并且以升序排列
阅读全文
摘要:哈希文件也称为散列文件,是利用哈希存储方式组织的文件,亦称为直接存取文件。它类似于哈希表,即根据文件中关键字的特点,设计一个哈希函数和处理冲突的方法,将记录哈希到存储设备上。 在哈希文件中,是使用一个函数(算法)来完成一种将关键字映射到存储器地址的映射,根据用户给出的关键字,经函数计算得到目标地址,
阅读全文
摘要:POC测试,即Proof of Concept,是业界流行的针对客户具体应用的验证性测试,根据用户对采用系统提出的性能要求和扩展需求的指标,在选用服务器上进行真实数据的运行,对承载用户数据量和运行时间进行实际测算,并根据用户未来业务扩展的需求加大数据量以验证系统和平台的承载能力和性能变化。 POC测
阅读全文
摘要:Gartner is known for its huge influence on purchasing as well as an unequaled events business. Forrester Research benefits from Gartner's weaknesses.
阅读全文
摘要:1·Intel公司 Intel是生产CPU的老大哥,它占有大约80%的市场份额,Intel生产的CPU就成了事实上的x86CPU技术规范和标准。最新的酷睿2成为CPU的首选。 2·AMD公司 除了Intel公司外,最有力的挑战的就是AMD公司。AMD公司专门为计算机、通信和消费电子行业设计和制造各种
阅读全文
摘要:DAS(Direct Access Storage—直接连接存储)是指将存储设备通过SCSI接口或光纤通道直接连接到一台计算机上。NAS(Network Attached Storage网络连接存储)即将存储设备通过标准的网络拓扑结构(例如以太网),连接到一群计算机上。NAS是部件级的存储方法,它的
阅读全文
摘要:Given a non-empty array of numbers, a0, a1, a2, … , an-1, where 0 ≤ ai < 231. Find the maximum result of ai XOR aj, where 0 ≤ i, j < n. Could you do t
阅读全文
摘要:The thief has found himself a new place for his thievery again. There is only one entrance to this area, called the "root." Besides the root, each hou
阅读全文
摘要:Given four lists A, B, C, D of integer values, compute how many tuples (i, j, k, l) there are such that A[i] + B[j] + C[k] + D[l] is zero. To make pro
阅读全文
摘要:转自:http://www.w3school.com.cn/css/css_boxmodel.asp 要知道在父元素:float, rel, abs位置情况下,box模型的变换情况,请见:http://www.cnblogs.com/hh54188/archive/2010/12/28/191907
阅读全文
摘要:可以看c++实现: https://github.com/mavam/libbf python实现:https://github.com/jaybaird/python-bloomfilter 转自:http://www.cnblogs.com/dolphin0520/archive/2012/11
阅读全文
摘要:转自:http://www.cnblogs.com/haippy/archive/2012/07/13/2590351.html 布隆过滤器[1](Bloom Filter)是由布隆(Burton Howard Bloom)在1970年提出的。它实际上是由一个很长的二进制向量和一系列随机映射函数组成
阅读全文
摘要:转自:https://my.oschina.net/u/2982571/blog/775452 设计背景 百度的链接处理系统每天处理万亿级的超链数据,在过去,这是一系列Mapreduce的批量过程,对时效性收录很不友好。在新一代搜索引擎架构设计中,我们采用流式、增量处理替代了之前的批量、全量处理。链
阅读全文
摘要:C: Consistency 一致性 • A: Availability 可用性(指的是快速获取数据) • P: Tolerance of network Partition 分区容忍性(分布式) 10年前,Eric Brewer教授指出了著名的CAP理论,后来Seth Gilbert 和 Nanc
阅读全文
摘要:Greenplum数据库基于PostgreSQL开源技术。本质上讲,它是多个PostgreSQL实例一起充当一个数据库管理系统。Greenplum以PostgreSQL 8.2.15为基础构建,在SQL支持、特性、配置选项和终端用户功能方面非常像PostgreSQL,用户操作Greenplum就跟平
阅读全文
摘要:现实中很多数据都是用图来表达的,比如社交网络中人与人的关系、地图数据、或是基因信息等等。RDBMS并不适合表达这类数据,而且由于海量数据的存在,让其显得捉襟见肘。NoSQL数据库的兴起,很好地解决了海量数据的存放问题,图数据库也是NoSQL的一个分支,相比于NoSQL中的其他分支,它很适合用来原生表
阅读全文
摘要:You are given two linked lists representing two non-negative numbers. The most significant digit comes first and each of their nodes contain a single
阅读全文
摘要:Given n pairs of parentheses, write a function to generate all combinations of well-formed parentheses. For example, given n = 3, a solution set is: c
阅读全文
摘要:转自:http://www.cnblogs.com/haippy/archive/2011/12/04/2276064.html 有时间再好好看下整个文章! 说起LevelDb也许您不清楚,但是如果作为IT工程师,不知道下面两位大神级别的工程师,那您的领导估计会Hold不住了:Jeff Dean和S
阅读全文
摘要:注意两个地方说法有出入,待实测! es可以根据磁盘使用情况来决定是否继续分配shard。默认设置是开启的,也可以通过api关闭:cluster.routing.allocation.disk.threshold_enabled: false 在开启的情况下,有两个重要的设置: cluster.rou
阅读全文
摘要:elasticsearch还有一个重要的参数bootstrap.mlockall,这个参数的目的是当你无法关闭系统的swap的时候,建议把这个参数设为true。防止在内存不够用的时候,elasticsearch的内存被交换至交换区,导致性能骤降。 mlock, munlock, mlockall,
阅读全文
摘要:转自:http://cjjwzs.iteye.com/blog/1059381 本文将从内存分页的原理,如何调整分页大小两节内容,向你阐述LargePage对JVM的性能有何提升作用,并在文末点明了大内分页的副作用。OK,让我们开始吧! 内存分页大小对性能的提升原理 首先,我们需要回顾一小部分计算机
阅读全文
摘要:Given an integer array with all positive numbers and no duplicates, find the number of possible combinations that add up to a positive integer target.
阅读全文
摘要:这是《AngularJS》这本书里面提供的一个例子: JS代码: HTML代码: CSS代码: 运行效果如下: compile阶段进行标签解析和变换,link阶段进行数据绑定等操作! 在所有module都装载完毕在之后,compile(element)(scope);开始编译和链接整个dom树(其实
阅读全文
摘要:Find all possible combinations of k numbers that add up to a number n, given that only numbers from 1 to 9 can be used and each combination should be
阅读全文
摘要:问题:js文件须严格保证加载顺序(比如上例的1.js要在2.js的前面),依赖性最大的模块一定要放到最后加载,当依赖关系很复杂的时候,代码的编写和维护都会变得困难! C语言中模块开发-include requireJS库——借鉴类似C中模块依赖解决方式(include) 假定主模块依赖jquery、
阅读全文
摘要:Given a non-empty string containing an out-of-order English representation of digits 0-9, output the digits in ascending order. Note: Example 1: Examp
阅读全文
摘要:Given a binary search tree, write a function kthSmallest to find the kth smallest element in it. Note: You may assume k is always valid, 1 ≤ k ≤ BST's
阅读全文
摘要:There are a number of spherical balloons spread in two-dimensional space. For each balloon, provided input is the start and end coordinates of the hor
阅读全文
摘要:There are n bulbs that are initially off. You first turn on all the bulbs. Then, you turn off every second bulb. On the third round, you toggle every
阅读全文
摘要:Given a set of intervals, for each of the interval i, check if there exists an interval j whose start point is bigger than or equal to the end point o
阅读全文
摘要:Given a string array words, find the maximum value of length(word[i]) * length(word[j]) where the two words do not share common letters. You may assum
阅读全文
摘要:转自:http://cek.io/blog/2015/12/03/event-loop/ What is JavaScript What is JavaScript anyway? Some words: It’s a single-threaded, non-blocking, asynchron
阅读全文
摘要:什么是事件循环 什么是事件循环 Node只运行在一个单一线程上,至少从Node.js开发者的角度是这样的。在底层, Node是通过libuv来实现多线程的。 Libuv库负责Node API的执行。它将不同的任务分配给不同的线程,形成一个事件循环, 以异步的方式将任务的执行结果返回给V8引擎。可以简
阅读全文
摘要:第3章 The Bourne-Again Shell Bash的主要组件:输入处理,解析,单词展开(word expansion)和其他命令处理,管道(pipeline)中的命令执行。这些组件构成一个流水线(pipeline),从键盘或脚本中获取字符,然后逐步转化为命令。 图3.1 Bash组件结构
阅读全文
摘要:Input History readline tracks the input history automatically. There are two different sets of functions for working with the history. The history for
阅读全文
摘要:CSDN:AngularJS的设计理念是什么?灵感来自于什么? Misko:AngularJS遵循的设计理念是——构建UI应该是声明式的。这也是AngularJS中标识符(directives)想法的灵感来源。 因此有了下文的摘录: 声明式编程和命令式编程的比较 先统一一下概念,我们有两种编程方式:
阅读全文
摘要:如下: 更智能点: python实现: 参考:http://docs.splunk.com/Documentation/Splunk/6.5.1/RESTTUT/RESTsearches
阅读全文
摘要:单机下多实例配置: discovery.zen.ping.multicast.enabled: falsediscovery.zen.ping.unicast.hosts: ["127.0.0.1:9300", "127.0.0.1:9301", "127.0.0.1:9302"]network.h
阅读全文
摘要:使用 HTTP Event Collector go to Settings > Data inputs > HTTP Event Collector. Then click the Global Settings button in the upper-right corner. 然后enable
阅读全文
摘要:edit~/.config/xfce4/xfconf/xfce-perchannel-xml/xfce4-keyboard-shortcuts.xmlfind the line <property name="<Super>Tab" type="string" value="switch
阅读全文
摘要:About the app key value store The app key value store (or KV store) provides a way to save and retrieve data within your Splunk apps, thereby letting
阅读全文
摘要:1. 在并列连词(and, but, for, nor, or, yet )前使用,用来连接句中的各分句。 The principal reason for this is that none of them possesses chlorophyll, andsince they cannot s
阅读全文
摘要:Forwarder deployment topologies You can deploy forwarders in a wide variety of scenarios. This topic provides an overview of some of the most useful t
阅读全文
摘要:Splunk Enterprise architecture and processes This topic discusses the internal architecture and processes of Splunk Enterprise at a high level. If you
阅读全文
摘要:头文件:#include <stdio.h>gets()函数用于从缓冲区中读取字符串,其原型如下: char *gets(char *string);gets()函数从流中读取字符串,直到出现换行符或读到文件尾为止,最后加上NULL作为字符串结束。所读取的字符串暂存在给定的参数string中。【返回
阅读全文
摘要:https://www.rizhiyi.com/ 日志易——中国版的splunk 官方号称 10万EPS (Event Per Second) 其他链接: http://doc.mbalib.com/view/7759ffbe943248dc0b84e75455ee897f.html http://
阅读全文
摘要:以后用到的话可以参考如下链接: http://safehammad.com/downloads/domain-specific-languages-and-python-2011-04-21.pdf http://www.dabeaz.com/ply/PLYTalk.pdf http://www.p
阅读全文
摘要:Given a n x n matrix where each of the rows and columns are sorted in ascending order, find the kth smallest element in the matrix. Note that it is th
阅读全文
摘要:Asterisk 1是基于GPLv2协议发布的一款开源电话应用平台。简单地说,这是一个服务端程序,用于处理电话的拨出、接入以及自定义流程。 一个人使用电话A呼叫另一个使用电话B的人。在此场景下,连接到Asterisk系统的有两个电话终端,因而分配了两个通道(如图1.2)。 图1.2 两个通道表示两条
阅读全文
摘要:参考:http://stackoverflow.com/questions/7356694/how-to-json-stringify-a-user-defined-class-in-javascript 结果为:
阅读全文
摘要:四、 Scrum过程 Scrum的过程如图4-1所示 图4-1 Scrum过程 4.1 建立Product Backlog Product Backlog是Product Owner把客户的商业需求按照优先级排出来的列表,整个项目存在一个唯一的Backlog,Backlog的内容由Product O
阅读全文
摘要:转自:http://www.cnblogs.com/sanjia/p/scrum_introduction.html Scrum介绍 摘要 如今,项目管理的步伐越来越快。项目管理需要更灵活、更积极地,向应客户的需求。使用敏捷项目管理方法,项目经理可以在不影响价值、质量和商业规则的前提下实现所有目标,
阅读全文
摘要:能力成熟度模型(Capability Maturity Model,英文缩写为CMM)是一种开发模型。CMM的基本思想是,软件问题是由我们管理软件过程的方法引起的,改进的过程将会生产出质量更好的软件。CMM的目标是改善现有软件开发过程,也可用于其它过程。它是对于软件组织在定义、实施、度量、控制和改善
阅读全文
摘要:对于es 2.4版本,要能定制spark partitioner需要如下方式启动spark shell: spark-2.0.0-bin-hadoop2.6/bin/spark-shell --jars elasticsearch-hadoop-5.0.1/dist/elasticsearch-sp
阅读全文
摘要:什么时候手动调用$apply()方法? 如果AngularJS总是将我们的代码wrap到一个function中并传入$apply(),以此来开始一轮$digest循环,那么什么时候才需要我们手动地调用$apply()方法呢?实际上,AngularJS对此有着非常明确的要求,就是它只负责对发生于Ang
阅读全文
摘要:Solution In short, instead of doing this: do this: $apply()和$digest()在AngularJS中是两个核心概念,但是有时候它们又让人困惑。而为了了解AngularJS的工作方式,首先需要了解$apply()和$digest()是如何工作
阅读全文
摘要:tcpdump是linux命令行下常用的的一个抓包工具,记录一下平时常用的方式,测试机器系统是ubuntu 12.04。 tcpdump的命令格式 tcpdump的参数众多,通过man tcpdump可以查看tcpdump的详细说明,这边只列一些笔者自己常用的参数: 各参数说明如下: -i:inte
阅读全文
摘要:Asterisk Russell Bryant Asterisk1 is an open source telephony applications platform distributed under the GPLv2. In short, it is a server application
阅读全文
摘要:根源:出现“task not serializable"这个错误,一般是因为在map、filter等的参数使用了外部的变量,但是这个变量不能序列化。特别是当引用了某个类(经常是当前类)的成员函数或变量时,会导致这个类的所有成员(整个类)都需要支持序列化。 解决方法: Job aborted due
阅读全文