上一页 1 ··· 5 6 7 8 9 10 11 下一页
摘要: from @汀芷, 感谢作者!HTMLParser具有小巧,快速的优点,缺点是相关文档比较少(英文的也少),很多功能需要自己摸索。对于初学者还是要费一些功夫的,而一旦上手以后,会发现HTMLParser的结构设计很巧妙,非常实用,基本你的各种需求都可以满足。 这里我根据自己这几个月来的经验,写了一点... 阅读全文
posted @ 2011-07-27 22:03 loveyakamoz 阅读(106107) 评论(12) 推荐(16) 编辑
摘要: HtmlParser关键包org.htmlparser定义了htmlparser的一些基础类,其中最为重要的是Parser。Parser是htmlParser的最核心的类。org.htmlparser.beans对Visitor和Filter的方法进行了封装,定义了针对一些常用HTML元素操作的JavaBean,简化对常用元素的提取操作。包括:FilterBean、HTMLLinkBean、HTMLTextBean、LinkBean、StringBean、BeanyBaby等。org.htmlparser.nodes定义了基础的node,包括:AbstractNode、RemarkNode、T 阅读全文
posted @ 2011-07-27 21:49 loveyakamoz 阅读(2662) 评论(0) 推荐(0) 编辑
摘要: 1如何将字串 String 转换成整数 int? A. 有两个方法: 1). int i = Integer.parseInt([String]); 或 i = Integer.parseInt([String],[int radix]); 2). int i = Integer.valueOf(my_str).intValue(); 注: 字串转成 Double, Float, Long 的方法大同小异. 2 如何将整数 int 转换成字串 String ? A. 有叁种方法: 1.) String s = String.valueOf(i); 2.) String s = Integer. 阅读全文
posted @ 2011-07-26 16:00 loveyakamoz 阅读(43030) 评论(0) 推荐(3) 编辑
摘要: 热力学统计物理中有熵增加原理,在信息论中也有对应的关于信息熵的著名定理――最大信息熵原理。在很多情况下,对一些随机事件,我们并不了解其概率分布,所掌握的只是与随机事件有关的一个或几个随机变量的平均值。例如,我们只知道一个班的学生考试成绩有三个分数档:80分、90分、100分,且已知平均成绩为90分。显然在这种情况下,三种分数档的概率分布并不是唯一的。因为在下列已知条件限制下(平均成绩)(概率归一化条件)有无限多组解,该选哪一组解呢?即如何从这些相容的分布中挑选出“最佳的”、“最合理”的分布来呢?这个挑选标准就是最大信息熵原理。按最大信息熵原理,我们从全部相容的分布中挑选这样的分布,它是在某些约 阅读全文
posted @ 2011-07-23 20:04 loveyakamoz 阅读(2305) 评论(0) 推荐(0) 编辑
摘要: HTTP请求格式当浏览器向Web服务器发出请求时,它向服务器传递了一个数据块,也就是请求信息,HTTP请求信息由3部分组成:l请求方法URI协议/版本l请求头(Request Header)l请求正文下面是一个HTTP请求的例子:GET/sample.jspHTTP/1.1Accept:image/gif.image/jpeg,*/*Accept-Language:zh-cnConnection:Keep-AliveHost:localhostUser-Agent:Mozila/4.0(compatible;MSIE5.01;Window NT5.0)Accept-Encoding:gzip, 阅读全文
posted @ 2011-07-22 10:29 loveyakamoz 阅读(39719) 评论(0) 推荐(3) 编辑
摘要: 1 学习的方向07年的时候曾经讲过一节Webcast,名叫《使您成为Windows专家的一些学习习 惯》。直到最近,还经常收到听众关于这一节课反馈和心得的电子邮件,可见学习方法论是大家非常关心的问题。因此,我的Blog就从讨论学习开始 吧。IT是一个需要活到老,学到老的行当。在摩尔定律的推动下,技术领域的革新和提高每天都在发生,这使得IT领域的工作者必须不断的学习,才能紧 跟技术的脚步。与此同时,IT人大多都是“热爱学习”的好同志,IT的细分领域非常广泛,从CPU电路设计到PhotoShop磨皮大法,无一不是IT人 感兴趣而希望学习的东西。在外部“摩尔定律”和内心“求知欲望”的双重推动下,IT 阅读全文
posted @ 2011-07-22 09:00 loveyakamoz 阅读(1690) 评论(0) 推荐(1) 编辑
摘要: 有人工作,有人继续上学,大家千万不要错过这篇文章,能看到这篇文章也是一种幸运,真的受益匪浅,对我有很大启迪,这篇文章将会改变我的一生,真的太好了,希望与有缘人分享,也希望对有缘人有所帮助!看完之后有种“相见恨晚”的感觉,特别激动,希望大家好好的珍藏这篇文章,相信多年以后,再来看这篇文章,一定有不同的感觉。正如"打工皇帝"唐骏说:"我觉得有两种人不要跟别人争利益和价值回报。第一种人就是刚刚进入企业的人,头5年千万不要说你能不能多给我一点儿工资,最重要的是能在企业里学到什么,对发展是不是有利……"人总是从平坦中获得的教益少,从磨难中获得的教益多;从平坦中获得 阅读全文
posted @ 2011-07-22 08:56 loveyakamoz 阅读(929) 评论(0) 推荐(2) 编辑
摘要: Introduction Log4j是一个开源代码的项目(Opensourceproject),它使开发人员能最大限度的灵活控制程序调试信息的输出,这一点它是通过额外的配置文件实现的。而且log4j开发包很容易上手,同时可能会使一些开发人员上瘾。 绝大多数的大型开发项目都有它们自己专门用于记录程序日志和对程序跟踪调试的API。许多经验证明,调试信息的管理在软件开发过程中扮演了十分重要的角色。日志管理通常提供了以下的几点好处:首先,它能在程序运行过程中精确的提供运行时的上下文(context)方便我开发人员找到BUG,一旦在程序中加入了Log输出的代码,程序运行过程中就能自动的生成并输出logg 阅读全文
posted @ 2011-07-21 21:32 loveyakamoz 阅读(5129) 评论(0) 推荐(1) 编辑
摘要: HttpClient程序包是一个实现了 HTTP 协议的客户端编程工具包,要想熟练的掌握它,必须熟悉 HTTP协议。一个最简单的调用如下:import java.io.IOException;import org.apache.http.HttpResponse;import org.apache.http.client.ClientProtocolException;import org.apache.http.client.HttpClient;import org.apache.http.client.methods.HttpGet;import org.apache.http.clie 阅读全文
posted @ 2011-07-21 21:02 loveyakamoz 阅读(40534) 评论(0) 推荐(3) 编辑
摘要: 第六章 高级主题6.1 自定义客户端连接在特定条件下,也许需要来定制HTTP报文通过线路传递,越过了可能使用的HTTP参数来处理非标准不兼容行为的方式。比如,对于Web爬虫,它可能需要强制HttpClient接受格式错误的响应头部信息,来抢救报文的内容。通常插入一个自定义的报文解析器的过程或定制连接实现需要几个步骤:提供一个自定义LineParser/LineFormatter接口实现。如果需要,实现报文解析/格式化逻辑。class MyLineParser extends BasicLineParser {@Overridepublic Header parseHeader(final Ch 阅读全文
posted @ 2011-07-21 21:01 loveyakamoz 阅读(11533) 评论(0) 推荐(2) 编辑
上一页 1 ··· 5 6 7 8 9 10 11 下一页