摘要: import json from random import sample, randint from uuid import uuid4 def gen_random_words(): with open("D:\\exp\\test_data\\dictionary.txt") as f: words = [word.strip() for word in f] ... 阅读全文
posted @ 2017-03-31 14:59 bonelee 阅读(381) 评论(1) 推荐(0) 编辑
摘要: 原生API提供的匹配筛选、排序和分组配置和SQL语法提供的WHERE、ORDER BY和GROUP BY语句的效果是一样的,你可以对匹配结果进行你需要的筛选、排序和分组匹配。例如,如果你要搜索MySQL中1990年代的书籍,并按照价格排序,可以这么写: 上述代码不仅一目了然而且也展示了通用API的使 阅读全文
posted @ 2017-03-31 14:39 bonelee 阅读(983) 评论(0) 推荐(0) 编辑
摘要: Coreseek 4.1 参考手册 / Sphinx 2.0.1-beta Sphinx--强大的开源全文检索引擎,Coreseek--免费开源的中文全文检索引擎 版权 © 2001-2011 Andrew Aksyonoff 版权 © 2008-2011 Sphinx Technologies I 阅读全文
posted @ 2017-03-31 14:36 bonelee 阅读(3174) 评论(0) 推荐(0) 编辑
摘要: query = "(user can be admin)" -> check all fields for the given words. If all words are found in a combination of any fields, document is a match.quer 阅读全文
posted @ 2017-03-31 14:06 bonelee 阅读(281) 评论(3) 推荐(0) 编辑
摘要: 发布时间:2016-01-12 作者:启明星辰 伴随着大数据时代的到来,启明星辰于2015年12月25日正式对外发布了面向企业级客户、融合大数据技术的新一代日志分析与审计平台(以下简称TSOC-SA3),以满足需要分析天量安全日志的政企客户的需求。该平台结合当前主流的大数据技术,并采用具有自主知识产 阅读全文
posted @ 2017-03-31 10:20 bonelee 阅读(3320) 评论(0) 推荐(0) 编辑
摘要: Evernote服务 我们的服务由以下几个组件组成。 分片(NoteStore) 分片是Evernote服务的核心单元,用于存储用户的笔记。每个分片最多可以支撑30万个Evernote用户,并包含了如下几个组件。 基于Tomcat的前端Web服务层:Evernote客户端会连接到这个层。 数据存储层 阅读全文
posted @ 2017-03-31 10:13 bonelee 阅读(366) 评论(1) 推荐(0) 编辑
摘要: 大数据信息安全日志审计分析方法 1.海量数据采集。大数据采集过程的主要特点和挑战是并发数高,因此采集数据量较大时,分析平台的接收性能也将面临较大挑战。大数据审计平台可采用大数据收集技术对各种类型的数据进行统一采集,使用一定的压缩及加密算法,在保证用户数据隐私性及完整性的前提下,可以进行带宽控制。 2 阅读全文
posted @ 2017-03-31 10:05 bonelee 阅读(6774) 评论(0) 推荐(0) 编辑