摘要: 伴随着前期的基础积累,翻过API,读过一些Demo,总觉得自己已经摸透了Prefuse,小打小闹似乎已经无法满足内心膨胀的自己。还记得儿时看的《武状元苏乞儿》中降龙十八掌最后一张居然是空白页,在千钧一发之际以为自己要嗝屁了,一阵东风让苏乞儿明白了,最后一章要做的原来是——整合。没错,今天我们就来好好 阅读全文
posted @ 2017-09-02 23:07 于继海 阅读(391) 评论(0) 推荐(0) 编辑
摘要: 可视化一路走来,体会很多;博客一路写来,收获颇丰;代码一路码来,思路越来越清晰。终究还是明白了一句古话:纸上得来终觉浅,绝知此事要躬行。 跌跌撞撞整合了个可视化小tool,零零碎碎结交了众多的志同道合之人,迷迷糊糊创建了我"可视化/Prefuse"的QQ群,详情可查看左侧的公告部分。此群旨在结实更多 阅读全文
posted @ 2017-09-02 23:07 于继海 阅读(175) 评论(0) 推荐(0) 编辑
摘要: 在Prefuse上摸打滚爬了一段时间,发现其和蔼可亲,容易上手。但是每每在打开gephi,导入数据再运行时,总还是在心里暗自赞叹gephi的绚烂之极,无与匹敌,当然,gephi也有自己的缺陷,但是gephi是一个在发展的、进步的、不断壮大的开源软件。纵使她曾经那般伤我,我仍是对其恋恋不舍,好吧,我已 阅读全文
posted @ 2017-09-02 23:06 于继海 阅读(3057) 评论(0) 推荐(1) 编辑
摘要: 继在园子里写的《Gephi可视化(一)——使用Gephi Toolkit创建Gephi应用》介绍了如何使用Gephi Toolkit工具集进行可视化编程后,本篇对Gephi Toolkit进行一个详尽的介绍,了解其工作原理以及与Gephi应用程序之间的差异,Gephi Toolkit对于平台的要求使 阅读全文
posted @ 2017-09-02 23:05 于继海 阅读(10809) 评论(0) 推荐(0) 编辑
摘要: 前言:有的时候自己不知道自己是井底之蛙,这并没有什么可怕的,因为你只要蜷缩在方寸之间的井里,无数次的生活轨迹无非最终归结还是一个圆形;但是可怕的是有一天你不得不从井里跳出来生活,需要重新审视井以外的生活,你就会发现世界如此美好,我知道的如此的少! 好比,但你看到如下代码 1 2 3 4 5 6 7 阅读全文
posted @ 2017-09-02 23:05 于继海 阅读(343) 评论(0) 推荐(0) 编辑
摘要: 前面依次看了nutch的准备工作inject和generate部分,抓取的fetch部分的代码,趁热打铁,我们下面来一睹parse即页面解析部分的代码,这块代码主要是集中在ParseSegment类里面,Let‘s go~~~ 上期回顾:上回主要讲的是nutch的fetch部分的功能代码实现,主要是 阅读全文
posted @ 2017-09-02 23:04 于继海 阅读(190) 评论(0) 推荐(0) 编辑
摘要: 走了一遍Inject和Generate,基本了解了nutch在执行爬取前的一些前期预热工作,包括url的过滤、规则化、分值计算以及其与mapreduce的联系紧密性等,自我感觉nutch的整个流程是很缜密的,起码从前面两个过程看是这样的。 前期回顾:上一期主要是讲解了nutch的第二个环节Gener 阅读全文
posted @ 2017-09-02 23:04 于继海 阅读(580) 评论(0) 推荐(0) 编辑
摘要: 本篇主要介绍如何在SWT下构建一个应用,如何安装SWT Designer并破解已进行SWT的可视化编程,Display以及Shell为何物、有何用,SWT中的常用组件、面板容器以及事件模型等。 1.可视化环境搭建(SWT Designer): (1).首先下载SWT Designer插件包SWT D 阅读全文
posted @ 2017-09-02 23:04 于继海 阅读(248) 评论(0) 推荐(0) 编辑
摘要: 最近看完nutch后总感觉像好好捯饬下solr,上次看到老大给我展现了下站内搜索我便久久不能忘怀。总觉着之前搭建的nutch配上solr还是有点呆板,在nutch爬取的时候就建立索引到solr服务下,然后在solr的管理界面中选择query,比如在q选项框中将“*:*”改写为“title:安徽”,则 阅读全文
posted @ 2017-09-02 23:03 于继海 阅读(285) 评论(0) 推荐(0) 编辑
摘要: 今天在老大和小梁的鼓舞和忽悠下(^_^),我决定还是把之前下载好的gephi源码好好利用起来,不在朝三暮四的想d3js或是什么vizster,用心去选择一个自己熟悉的,而不是一直在各种困难之间来回徘徊,踌躇不前,虚度光阴。老大有句话说的好,有问题了就要想着怎么去解决它,而不是躲避,要想尽各种办法去解 阅读全文
posted @ 2017-09-02 23:02 于继海 阅读(746) 评论(0) 推荐(0) 编辑
摘要: 继上次匆匆搭建起结合solr和nutch的所谓站内搜索引擎之后,虽当时心中兴奋不已,可是看了看百度,再只能看看我的控制台的打印出每个索引项的几行文字,哦,好像差距还是有点大…… 简陋的信息显示环境最起码给了我一个信号,这条路没有走错,好吧,让我们来继续探索搜索引擎的奥秘吧。 上期回顾:上次主要是介绍 阅读全文
posted @ 2017-09-02 23:02 于继海 阅读(440) 评论(0) 推荐(0) 编辑
摘要: 看nutch的源码仿佛就是一场谍战片,而构成这精彩绝伦的谍战剧情的就是nutch的每一个从inject->generate->fetch->parse->update的环节,首先我党下派任务给优秀的地下工作者(inject),地下工作者经过一系列处理工作(告诉自己媳妇孩子要出差什么的……)以及加入自 阅读全文
posted @ 2017-09-02 23:02 于继海 阅读(180) 评论(0) 推荐(0) 编辑
摘要: 在上篇《可视化工具gephi源码探秘(一)》中主要介绍了如何将gephi的源码导入myeclipse中遇到的一些问题,此篇接着上篇而来,主要讲解当下通过myeclipse导入gephi源码的可行性不高以及熟悉netbeans,并把原本基于netbeans平台开发的gephi源码导入进netbeans 阅读全文
posted @ 2017-09-02 23:01 于继海 阅读(593) 评论(0) 推荐(0) 编辑
摘要: 集合相关操作 集合是一个无序的,不重复的数据组合,它有着两个主要作用:去重以及关系测试。 去重指的是当把一个列表变成了集合,其中重复的内容就自动的被去掉了 关系测试指的是,测试两组数据之间的交集、差集、并集等关系。 去重测试代码如下: # 创建一个列表 -- 里面存在一些重复值 test_list 阅读全文
posted @ 2017-09-02 23:00 于继海 阅读(244) 评论(0) 推荐(0) 编辑
摘要: # 打开旧文件 f = open('file_text.txt','r',encoding='utf-8') # 打开新文件 f_new = open('file_text_bak.txt','w',encoding='utf-8') # 循环读取旧文件 for line in f: # 进行判断 阅读全文
posted @ 2017-09-02 23:00 于继海 阅读(4410) 评论(0) 推荐(0) 编辑
摘要: 常见的数据类型 列表 在python中,列表的创建可以是由[]两个方括号组成的。在其他语言中,被称之为数组。 列表里可以存放一组值,并且系统默认的给列表里的每一个元素以索引值,方便查找和使用。 如下: #创建一个列表,并且保存一定的数据 user_list = ['刘德华','张学友','张靓颖', 阅读全文
posted @ 2017-09-02 22:59 于继海 阅读(251) 评论(0) 推荐(0) 编辑
摘要: Python文件相关操作 打开文件 打开文件,采用open方法,会将文件的句柄返回,如下: f = open('test_file.txt','r',encoding='utf-8') 在上面的代码中,open()方法进行打开文件等相关操作,open()方法其中第一个参数是要打开的文件的文件路径,第 阅读全文
posted @ 2017-09-02 22:58 于继海 阅读(394) 评论(0) 推荐(0) 编辑
摘要: 字典 字典的增删改查 字典的创建方式: # 创建字典类型 info = { 'name':'李白', 'age':'25', 'sex':'男' } msg = { 'user01':'Longzeluola', 'user02':'xiaozemaliya', 'user03':'cangjing 阅读全文
posted @ 2017-09-02 22:58 于继海 阅读(357) 评论(0) 推荐(0) 编辑
摘要: 字符串常用方法 capitalize() String.capitalize() 将字符串首字母变为大写 name = 'xiaoming' new_name = name.capitalize() print(new_name) 运行结果:Xiaoming count() String.count 阅读全文
posted @ 2017-09-02 22:57 于继海 阅读(8985) 评论(0) 推荐(2) 编辑
摘要: markdown 基础 介绍 Markdown是一种可以使用普通文本编辑器编写的标记语言,通过简单的标记语法,它可以使普通文本内容具有一定的格式。 说的简单一点,markdown其实就是一种简单的文本,与普通的文本文件 (txt文件)不同的是,支持一些特殊的符号,通过特殊的符号来表示不同的语义,并且 阅读全文
posted @ 2017-09-02 22:54 于继海 阅读(188) 评论(0) 推荐(0) 编辑
友情链接:回力鞋 | 中老年高档女装