随笔分类 -  大数据

摘要:在Neo4j中使用``n10s.rdf.import.fetch()``函数导入RDF数据时,路径的定义方式取决于你运行Neo4j数据库的操作系统和文件系统的配置。在给定路径之前,请确保你具有适当的文件系统权限。 以下是路径定义的示例: - 在Windows上: ``` CALL n10s.rdf. 阅读全文
posted @ 2023-06-02 16:55 又一岁荣枯 阅读(109) 评论(0) 推荐(0) 编辑
摘要:## 一、背景 众所周知,``Neo4j`` 本身是不支持导入 ``RDF`` 文件的。但我们可以借助 ``neosemantics`` 来进行导入。 ``neosemantics`` 简称 ``n10s`` ,4.0之前的把呢不能叫 ``semantics`` 。 现在官网也无法访问 4.0 之前 阅读全文
posted @ 2023-06-01 22:54 又一岁荣枯 阅读(1014) 评论(0) 推荐(0) 编辑
摘要:要在 Python 中使用 py2neo 将新节点连接到已存在的节点标签,你可以执行以下步骤: 1. 导入所需的类和函数: ```python from py2neo import Graph, Node, Relationship ``` 2. 连接到 Neo4j 数据库: ```python g 阅读全文
posted @ 2023-06-01 10:18 又一岁荣枯 阅读(74) 评论(0) 推荐(0) 编辑
摘要:## 前提 经过度娘得知,可以使用第三方包去重,但只管去重,你后面关系乱了人家第三方包不管。 或者 直接在neo4j里面使用数据库语言去重,但关系还是得重新建立。况且,我想用python去重。 干货来了 后来,我换了个思路,那么就是合并节点。(虽然跟去重差不多) 但总归总做出来了 使用NodeMat 阅读全文
posted @ 2023-05-31 23:49 又一岁荣枯 阅读(615) 评论(0) 推荐(0) 编辑
摘要:## letter.py ```python import scrapy from scrapy.linkextractors import LinkExtractor from scrapy.spiders import CrawlSpider, Rule from letterBeijing.i 阅读全文
posted @ 2023-05-26 22:14 又一岁荣枯 阅读(54) 评论(0) 推荐(0) 编辑
摘要:## 下载 Jena 因为官网的下载速度比较慢,为了方便,这里我们直接贴出 Apache Jena 和 Apache Jena Fuseki 的3.17.0 版本(Zip包)的百度云链接 链接: https://pan.baidu.com/s/1EynCU443AoO5j8PohgThXQ 提取码: 阅读全文
posted @ 2023-05-14 21:37 又一岁荣枯 阅读(311) 评论(0) 推荐(0) 编辑
摘要:图形数据库(Graph Database)是NoSQL数据库家族中特殊的存在,用于存储丰富的关系数据,Neo4j 是目前最流行的图形数据库,支持完整的事务,在属性图中,图是由顶点(Vertex),边(Edge)和属性(Property)组成的,顶点和边都可以设置属性,顶点也称作节点,边也称作关系,每 阅读全文
posted @ 2023-05-11 14:50 又一岁荣枯 阅读(461) 评论(0) 推荐(0) 编辑
摘要:1.安装依赖包 //一键安装上面四个依赖 yum -y install gcc zlib zlib-devel pcre-devel openssl openssl-devel 2.下载并解压安装包 cd /usr/local mkdir nginx cd nginx //下载tar包 wget h 阅读全文
posted @ 2023-04-24 22:23 又一岁荣枯 阅读(2373) 评论(0) 推荐(0) 编辑
摘要:Elasticsearch 是一个分布式可扩展的实时搜索和分析引擎. Elasticsearch 是一个建立在全文搜索引擎 Apache Lucene(TM) 基础上的搜索引擎. 当然 Elasticsearch 并不仅仅是 Lucene 那么简单,它不仅包括了全文搜索功能,还可以进行以下工作: 分 阅读全文
posted @ 2022-11-16 15:52 又一岁荣枯 阅读(28) 评论(0) 推荐(0) 编辑
摘要:前言: 在我们的日常开发中,关系型数据库和非关系型数据库的使用已经是一个成熟的软件产品开发过程中必不可却的存储数据的工具了。那么用了这么久的关系数据库和非关系型数据库你们都知道他们之间的区别了吗?下面我们来详细的介绍一下。 关系型数据库(SQL): 什么是(SQL)关系型数据库: 关系型数据库指的是 阅读全文
posted @ 2022-10-11 20:23 又一岁荣枯 阅读(143) 评论(0) 推荐(0) 编辑
摘要:在 hive 环境下使用命令: hive> show databases; # 查看所有的数据库 OK app dev hive> use dev; # 选择dev数据库 OK hive> show create table test_table; # 打印创建表的sql语句 sql语句中有一项为 阅读全文
posted @ 2022-10-06 09:47 又一岁荣枯 阅读(135) 评论(0) 推荐(0) 编辑
摘要:hdfs http://hadoop102:9870/ hbase http://hadoop102:16010/ 阅读全文
posted @ 2022-09-25 21:03 又一岁荣枯 阅读(32) 评论(0) 推荐(0) 编辑
摘要:hive 以元数据的方式启动hive [hzy@hadoop102 hive]$ bin/hive --service metastore 启动hiveservice2 bin/hive --service hiveserver2 启动binline bin/beeline -u jdbc:hive 阅读全文
posted @ 2022-09-19 19:18 又一岁荣枯 阅读(22) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示