01 2019 档案

摘要:Elasticsearch === Elasticsearch是一个高性能高扩展性的分布式索引系统,基于apache lucene。 "官方指导文档" 可结合kibana工具进行可视化。 概念: index 索引 : 类似SQL中的一张表,索引名必须是 全小写 单词。 type(索引类型):设计初衷 阅读全文
posted @ 2019-01-23 14:56 二球悬铃木 阅读(711) 评论(0) 推荐(0) 编辑
摘要:fastjson === "alibaba fastjson" 是阿里巴巴公司开源维护的一个处理json格式数据的java工具库。 功能特性: 数据绑定databind (json string java object, JSON java object) 保持单一对象。序列化时相同的java对象引 阅读全文
posted @ 2019-01-18 16:49 二球悬铃木 阅读(871) 评论(0) 推荐(0) 编辑
摘要:Java编程语言相关经验知识。 collection / stream Iterable Stream: StreamSupport.stream(iterable.splitor(), parallel:false) Iterator Stream: 转化为Iterator Stream: Spl 阅读全文
posted @ 2019-01-16 16:56 二球悬铃木 阅读(321) 评论(0) 推荐(0) 编辑
摘要:JWPL处理维基百科数据用于NLP === 处理zhwiki "JWPL" 是一个Wikipedia处理工具,主要功能是将 "Wikipedia dump" 的文件经过处理、优化导入mysql数据库,用于NLP过程。以下以zhwiki 20170201为例。 "JWPLDataMachine" 用以 阅读全文
posted @ 2019-01-16 10:36 二球悬铃木 阅读(1134) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示