君子博学而日参省乎己 则知明而行无过矣

博客园 首页 新随笔 联系 订阅 管理
  1057 随笔 :: 381 文章 :: 141 评论 :: 169万 阅读

10 2013 档案

摘要:简介:不可否认,万维网是到目前为止世界上最丰富和最密集的信息来源。但是,它的结构使它很难用系统的方法来利用信息。本文描述的方法和工具将使那些熟悉 Web 最常用技术的开发人员能快速而便捷地获取他们所需的以 Web 方式发布的信息。在信息时代快速成长起来的万维网导致各种各样的公用信息被大量分发。 不幸的是,尽管作为信息主要载体的 HTML 提供了一种方便地向读者呈现信息的方法, 但它可能并不是一个很好的可以从中自动抽取与数据驱动的服务或应用程序相关的信息的结构。已经尝试了多种方法来解决这个问题。大多数方法都采用一些专用查询语言的形式 把 HTML 页面的各个部分映射成代码,而这些代码将 Web 阅读全文
posted @ 2013-10-27 19:08 刺猬的温驯 阅读(764) 评论(0) 推荐(0) 编辑

摘要:【背景】最近和之前,折腾了这个:【教程】模拟登陆百度之Java代码版然后,对于Java的HttpClient,有了点了解。现在整理如下:Java本身没有Http相关的库Java本身,没有内置对应的Http相关的库函数(与此对应的是,关于http处理,其他语言,都有内置的库:Python有内置的urllib,urllib2等模块C#有System.Net,System.Web相关库)Java中用的最多的http的库就是:HttpClient而关于网络处理,http相关处理,则用的最多的就是:HttpClient而HttpClient,是Apache这个组织所发布的。其对应的,完整的名称其实是:A 阅读全文
posted @ 2013-10-20 17:07 刺猬的温驯 阅读(10757) 评论(1) 推荐(0) 编辑

摘要:apache mina是一个基于java nio的网络通信框架,为TCP UDP ARP等协议提供了一致的编程模型;其源码结构展示了优秀的设计案例,可以为我们的编程事业提供参考。依照惯例,首先搭建apache mina 2.0的开发环境,本人采用maven作为项目管理工具,需要添加的依赖pom.xm... 阅读全文
posted @ 2013-10-12 00:37 刺猬的温驯 阅读(606) 评论(0) 推荐(1) 编辑

摘要:本文可看成是对Doug Lea Scalable IO in Java一文的翻译。当前分布式计算 Web Services盛行天下,这些网络服务的底层都离不开对socket的操作。他们都有一个共同的结构:1. Read request2. Decode request3. Process service4. Encode reply5. Send reply经典的网络服务的设计如下图,在每个线程中完成对数据的处理:但这种模式在用户负载增加时,性能将下降非常的快。我们需要重新寻找一个新的方案,保持数据处理的流畅,很显然,事件触发机制是最好的解决办法,当有事件发生时,会触动handler,然后开始 阅读全文
posted @ 2013-10-02 18:47 刺猬的温驯 阅读(433) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示