03 2019 档案

摘要:janusgraph的数据模型 》参考 1.简介 janusgraph的数据模型,就是一数据结构中得图结构相似。所以janusgraph的数据schema主要定义在三个要素上:顶点,边,属性。上面的god图中,红色的点就是顶点,点与点之间的线就是边,在点和边上的方框中写的就是点和边的属性 在janu 阅读全文
posted @ 2019-03-19 17:08 大数据下的小人物 阅读(1760) 评论(0) 推荐(0) 编辑
摘要:janusgraph的简单使用 当安装好以后简单的使用janusgraph 1.进入janusgraph的shell命令界面 [root@had214 janusgraph-0.3.1-hadoop2]# bin/gremlin.sh 2.使用janusgraph自带的一个gods图库进行简单的操作 阅读全文
posted @ 2019-03-18 16:40 大数据下的小人物 阅读(841) 评论(0) 推荐(0) 编辑
摘要:图数据库的简介-来源百度百科 1.简介 图形数据库是NoSQL数据库的一种类型,它应用图形理论存储实体之间的关系信息。图形数据库是一种非关系型数据库,它应用图形理论存储实体之间的关系信息。最常见例子就是社会网络中人与人之间的关系。关系型数据库用于存储“关系型”数据的效果并不好,其查询复杂、缓慢、超出 阅读全文
posted @ 2019-03-18 14:39 大数据下的小人物 阅读(1284) 评论(0) 推荐(0) 编辑
摘要:注:本次安装janusgraph基于es和hbse,所以先安装es和hbase 1.安装jdk 2.安装janusgraph 解压安装文件至/usr/janusgraph-0.3.1 配置启动配置文件conf/gremlin-server/gremlin-server.yaml 配置启动配置文件co 阅读全文
posted @ 2019-03-18 11:02 大数据下的小人物 阅读(2491) 评论(2) 推荐(0) 编辑
摘要:思路:创建一个临时表,在原有的表结构基础上增加一列编号,再进行去除重复的记录 本例子是在对表 main_body_sz 进行去重 创建一个临时表 删除重复的记录 将rownum列删除 阅读全文
posted @ 2019-03-13 14:08 大数据下的小人物 阅读(1595) 评论(0) 推荐(0) 编辑
摘要:在ES存储的文档,进行存储时,会对文档的内容进行分析和分词 分析的过程: 首先,将一块文本分成适合于倒排索引的独立的 词条 , 之后,将这些词条统一化为标准格式以提高它们的“可搜索性”,或者 recall 分析器的三个功能 1.字符过滤器 首先,字符串按顺序通过每个 字符过滤器 。他们的任务是在分词 阅读全文
posted @ 2019-03-11 15:23 大数据下的小人物 阅读(1111) 评论(0) 推荐(0) 编辑
摘要:Elasticsearch底层使用的使用的lucene lucene使用的是倒排索引的方式来进行加快检索速度 倒排索引的原理 doc_1 The quick brown fox jumped over the lazy dog doc_2 Quick brown foxes leap over la 阅读全文
posted @ 2019-03-11 14:49 大数据下的小人物 阅读(2249) 评论(0) 推荐(0) 编辑
摘要:1.空搜索 GET <写路径>/_search 返回的结果: eg: GET propdict/doc/_search hits 返回结果中最 重要的部分是 hits ,它 包含 total 字段来表示匹配到的文档总数,并且一个 hits 数组包含所查询结果的前十个文档。 在 hits 数组中每个结 阅读全文
posted @ 2019-03-11 14:26 大数据下的小人物 阅读(841) 评论(0) 推荐(0) 编辑
摘要:ES的入门:ES的雇员文档的设计和实现功能 ES的存放中包括:索引,类型,文档,字段 PUT /megacorp/employee/1{{ "first_name" : "John", "last_name" : "Smith", "age" : 25, "about" : "I love to g 阅读全文
posted @ 2019-03-11 10:35 大数据下的小人物 阅读(484) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示