摘要: HttpClient 类库中GetMethod类的getResponseBody方法返回的是byte[]类型,要操作起来不方便,我想把它转化成String类型。 查了网上的资料,有说法认为用这种方法比较好 BASE64Encoder enc=new BASE64Encoder(); String 转换后的string=enc.encode(byte数组); 参考http://hi.baidu.co... 阅读全文
posted @ 2009-03-02 09:40 菁小兔 阅读(5301) 评论(0) 推荐(0) 编辑
摘要: 搜索引擎用爬虫(crawler)获取web上的资源,然后对抓下的网页建立索引 作者说的建自己的爬虫的几个原因,我的原因是属于monitor sites crawler的原理和人们用浏览器浏览网页的原理一样,只不过是automate了这个过程 具体实现流程:在run方法中。维护两个列表 to-search list 和 already-searched list,并考虑了robots exclus... 阅读全文
posted @ 2009-02-27 10:51 菁小兔 阅读(176) 评论(0) 推荐(0) 编辑
摘要: 这一段时间快被这个晕死人的软件工程大作业折腾死了,总体感觉倒也不是说有多难,但理解这个juddi做的接口要uddi基础知识,像我这样菜鸟级用户,连web service都没怎么听说过,摸到门都花了好多时间和精力。网上这方面的资料实在是太少了,中文的帖子全是讲juddi的安装配置的,而且都是转来转去的,有的安装时遇到的关键性的问题都没有人回答,英文都说实话又看不太进去...= =诶诶诶~ 由于参考资... 阅读全文
posted @ 2009-01-09 11:03 菁小兔 阅读(2482) 评论(2) 推荐(0) 编辑