上一页 1 ··· 6 7 8 9 10 11 下一页
摘要: 第五章 HTTP客户端服务5.1 HttpClient门面HttpClient接口代表了最重要的HTTP请求执行的契约。它没有在请求执行处理上强加限制或特殊细节,而在连接管理,状态管理,认证和处理重定向到具体实现上留下了细节。这应该使得很容易使用额外的功能,比如响应内容缓存来装饰接口。DefaultHttpClient是HttpClient接口的默认实现。这个类扮演了很多特殊用户程序或策略接口实现负责处理特定HTTP协议方面,比如重定向到处理认证或做出关于连接持久化和保持活动的持续时间决定的门面。这使得用户可以选择使用定制,具体程序等来替换某些方面默认实现。DefaultHttpClient 阅读全文
posted @ 2011-07-21 21:00 loveyakamoz 阅读(19132) 评论(0) 推荐(1) 编辑
摘要: 第四章 HTTP认证HttpClient提供对由HTTP标准规范定义的认证模式的完全支持。HttpClient的认证框架可以扩展支持非标准的认证模式,比如NTLM和SPNEGO。4.1 用户凭证任何用户身份验证的过程都需要一组可以用于建立用户身份的凭据。用户凭证的最简单的形式可以仅仅是用户名/密码对。UsernamePasswordCredentials代表了一组包含安全规则和明文密码的凭据。这个实现对由HTTP标准规范中定义的标准认证模式是足够的UsernamePasswordCredentials creds = new UsernamePasswordCredentials(" 阅读全文
posted @ 2011-07-21 20:59 loveyakamoz 阅读(20973) 评论(0) 推荐(5) 编辑
摘要: 第三章 HTTP状态管理原始的HTTP是被设计为无状态的,面向请求/响应的协议,没有特殊规定有状态的,贯穿一些逻辑相关的请求/响应交换的会话。由于HTTP协议变得越来越普及和受欢迎,越来越多的从前没有打算使用它的系统也开始为应用程序来使用它,比如作为电子商务应用程序的传输方式。因此,支持状态管理就变得非常必要了。网景公司,一度成为Web客户端和服务器软件开发者的领导方向,在它们基于专有规范的产品中实现了对HTTP状态管理的支持。之后,网景公司试图通过发布规范草案来规范这种机制。它们的努力通过RFC标准跟踪促成了这些规范定义。然而,在很多应用程序中的状态管理仍然基于网景公司的草案而不兼容官方的规 阅读全文
posted @ 2011-07-21 20:58 loveyakamoz 阅读(24846) 评论(0) 推荐(1) 编辑
摘要: 第二章 连接管理HttpClient有一个对连接初始化和终止,还有在活动连接上I/O操作的完整控制。而连接操作的很多方面可以使用一些参数来控制。2.1 连接参数这些参数可以影响连接操作:'http.socket.timeout':定义了套接字的毫秒级超时时间(SO_TIMEOUT),这就是等待数据,换句话说,在两个连续的数据包之间最大的闲置时间。如果超时时间是0就解释为是一个无限大的超时时间。这个参数期望得到一个java.lang.Integer类型的值。如果这个参数没有被设置,那么读取操作就不会超时(无限大的超时时间)。'http.tcp.nodelay':决 阅读全文
posted @ 2011-07-21 14:57 loveyakamoz 阅读(41919) 评论(6) 推荐(4) 编辑
摘要: 前言超文本传输协议(HTTP)也许是当今互联网上使用的最重要的协议了。Web服务,有网络功能的设备和网络计算的发展,都持续扩展了HTTP协议的角色,超越了用户使用的Web浏览器范畴,同时,也增加了需要HTTP协议支持的应用程序的数量。尽管java.net包提供了基本通过HTTP访问资源的功能,但它没有提供全面的灵活性和其它很多应用程序需要的功能。HttpClient就是寻求弥补这项空白的组件,通过提供一个有效的,保持更新的,功能丰富的软件包来实现客户端最新的HTTP标准和建议。为扩展而设计,同时为基本的HTTP协议提供强大的支持,HttpClient组件也许就是构建HTTP客户端应用程序,比如 阅读全文
posted @ 2011-07-21 14:42 loveyakamoz 阅读(156540) 评论(21) 推荐(26) 编辑
摘要: 在Eclipse中构建Heritrix这里采用的是Heritrix 1.14.4(2010年5月10日的版本 目前来看是最新版本)1.首先从http://sourceforge.net/projects/archive-crawler/ 中下载heritrix-1.14.4.zipheritrix-1.14.4-src.zip2.在Eclipse 中创建一个java project的工程,分别对heritrix-1.14.4.zipheritrix-1.14.4-src.zip 进行解压。3.将heritrix-1.14.4-src.zip解压中的src/java 中的 com、org、st三 阅读全文
posted @ 2011-07-04 08:57 loveyakamoz 阅读(1006) 评论(0) 推荐(0) 编辑
摘要: 过程如下(采用本地安装):1. 下载Texlive 2009 镜像,校验MD5值。下载地址 http://ftp.ctex.org/mirrors/CTAN/systems/texlive/Images2. 安装perl-tk包,以便使用图形界面进行安装。sudo apt-get install perl-tk解压下载到的压缩文件并挂载iso镜像(为了方便,这里把镜像重命名为texlive2009.iso了)。 sudo mount -o loop texlive2009.iso /mnt进入/mnt目录,输入命令sudo ./install-tl –gui之后出现图形界面。之后的操作就比较简 阅读全文
posted @ 2011-05-27 18:44 loveyakamoz 阅读(1088) 评论(0) 推荐(0) 编辑
摘要: 其基本思想是使用训练集为每个类构造一个原型向量,构造方法如下:给定一个类,训练集中所有属于这个类的文档对应向量的分量用正数表示,所有不属于这个类的文档对应向量的分量用负数表示,然后把所有的向量加起来,得到的和向量就是这个类的原型向量,定义两个向量的相似度为这两个向量夹角的余弦,逐一计算训练集中所有文档和原型向量的相似度,然后按一定的算法从中挑选某个相似度作为界。给定一篇文档,如果这篇文档与原型向量的相似度比界大,则这篇文档属于这个类,否则这篇文档就不属于这个类。Rocchio算法的突出优点是容易实现,计算(训练和分类)特别简单,它通常用来实现衡量分类系统性能的基准系统,而实用的分类系统很少采用 阅读全文
posted @ 2011-05-24 15:24 loveyakamoz 阅读(1154) 评论(0) 推荐(0) 编辑
摘要: 1. 测试整个bitset对象如果bitset对象中有一个或多个二进制位置为1,则any操作返回true,也就是说,其返回值等于1;相反,如果bitset对象中的二进制位全为0,则none操作返回true。bitset32 bitvec; // 32 bits, all zerobool is_set = bitvec.any(); // false, all bits are zerobool is_not_set = bitvec.none(); // true, all bits are zero如果需要知道置为1的二进制位的个数,可以使用count操作,该操作返回置为1的二进制位的 阅读全文
posted @ 2010-12-08 16:21 loveyakamoz 阅读(527) 评论(0) 推荐(0) 编辑
摘要: FileSplit:文件的子集--文件分割体 简介: 这篇文档描述在hadoop中map和reduce操作是怎样具体完成的。如果你对Google的MapReduce各式模式不熟悉,请先参阅MapReduce--http://labs.google.com/papers/mapreduce.html Map 由于Map是并行地对输入的文件集进行操作,所以它的第一步(FileSplit) 就是把文... 阅读全文
posted @ 2010-12-03 13:50 loveyakamoz 阅读(467) 评论(0) 推荐(0) 编辑
上一页 1 ··· 6 7 8 9 10 11 下一页