摘要:
和关系数据库一样,Neo4j同样可以创建索引来加快查找速度。 在关系数据库中创建索引需要索引字段和指向记录的指针,通过索引可以快速查找到表中的行。 在Neo4j中,其索引是通过属性来创建,便于快速查找节点或者关系。 手动索引 先来说一下怎样创建手动索引。 创建索引采用显示创建,就像添加节点一样添加索 阅读全文
摘要:
项目的创建及配置 因为Neo4j依赖的jar包比较多,所以推荐使用Maven来管理。 首先创建一个Maven Project,添加依赖: 使用的是3.2.6版本,对应版本的Neo4j安装地址摸我。 使用嵌入式数据库 配置好之后,就可以开始了,第一步是学习开启和关闭数据库。 无论是创建一个新的数据库, 阅读全文
摘要:
WebMagic的配置:http://www.cnblogs.com/justcooooode/p/7913365.html 爬取目标 最近需要对一些领域概念做分析,选择利用百度百科爬取对应的词条,从中获取信息和知识。 我将查询结果分为两类,一种是百科中已收录,另一种就是未被收录,虽然未被收录但还是 阅读全文
摘要:
第三版英文版已经出了。。。 看来要一边整理第二版,一边读第三版了。 第1条:考虑用静态工厂方法替代构造器 第2条:遇到多个构造器参数时要考虑用构建器 第3条:用私有构造器或者枚举类型强化Singleton属性 第4条:通过私有构造器强化不可实例化的能力 第5条:避免创建不必要的对象 第6条:消除过期 阅读全文
摘要:
Item 1. 考虑用静态工厂方法替代构造器 获得一个类的实例时我们都会采取一个公有的构造器。Foo x = new Foo(); 同时我们应该掌握另一种方法就是静态工厂方法(static factory method)。 一句话总结,静态工厂方法其实就是一个返回类的实例的静态方法。 书中给出的例子 阅读全文
摘要:
初学爬虫,WebMagic作为一个Java开发的爬虫框架很容易上手,下面就通过一个简单的小例子来看一下。 WebMagic框架简介 WebMagic框架包含四个组件,PageProcessor、Scheduler、Downloader和Pipeline。 这四大组件对应爬虫生命周期中的处理、管理、下 阅读全文
摘要:
算法介绍 最近要做领域概念的提取,TFIDF作为一个很经典的算法可以作为其中的一步处理。 关于TFIDF算法的介绍可以参考这篇博客http://www.ruanyifeng.com/blog/2013/03/tf-idf.html。 计算公式比较简单,如下: 预处理 由于需要处理的候选词大约后3w+ 阅读全文
摘要:
原文地址:https://javaranch.com/journal/200409/ScjpTipLine-StringsLiterally.html 作者:Corey McGlone 让我们由一个简单的问题开始,什么是字符串字面量?一个字符串字面量就是两个双引号之间的字符序列,形如“string” 阅读全文
摘要:
接口中的默认方法和静态方法 先考虑一个问题,如何向Java中的集合库中增加方法?例如在Java 8中向Collection接口中添加了一个forEach方法。 如果在Java 8之前,对于接口来说,其中的方法必须都为抽象方法,也就是说接口中不允许有接口的实现,那么就需要对每个实现Collection 阅读全文
摘要:
刚开始看字符串的时候,经常会看到类似的题,难免会有些不解,查看答案总会提到字符串常量池、运行常量池等概念,很容易让人搞混。 下面就来说说Java中的字符串到底是怎样创建的。 Java内存区域 String有两种赋值方式,第一种是通过“字面量”赋值。 第二种是通过new关键字创建新对象。 String 阅读全文