08 2014 档案
摘要:本篇主要介绍一款开源免费跨平台基于JVM的复杂网络分析软件gephi的源码在导入myeclipse遇到的问题和一些尝试的解决方法以及如何选用netbeans平台进行源码导入工作,介绍了gephi的原生开发平台的相关信息,穿插介绍了个gephi toolkit的用法,并最终实现在netbeans中通过源码启动gephi。
阅读全文
摘要:本篇主要介绍了一款可视化工具gephi的源码结构以及如何导入到Myeclipse中,遇到的问题以及一些摸索性的尝试,如何通过maven从远程仓库下载jar包。
阅读全文
摘要:本篇主要通过利用nutch爬取的页面,并将索引写入solr服务器中,结合solrj的api编写界面化的搜索界面,包括高亮和搜索的规则和关键字的设置,点击搜索实现指定规则或是关键字的搜索并呈现搜索结果。
阅读全文
摘要:本文主要介绍nutch的五个环节中的最后一个流程update的具体执行流程。
阅读全文
摘要:本篇主要是通过solrj访问虚拟机中部署在tomcat的solr服务器,根据指定的查询条件,得到搜索结果,并打印出搜索结果。
阅读全文
摘要:本篇主要解读了nutch的第四个环节parse过程的执行流程和处理方法。
阅读全文
摘要:本篇主要重点讲解了阅读nutch源码的fetch部分的感受以及通过调试追踪整个fetch的执行流程,其中包括通过生产者-消费者的模型解决爬虫问题,nutch如何爬取页面以及对于不同的返回状态做相应的处理机制,其中还涉及到一些多线程的知识。
阅读全文