网络代理
从JDK1.5开始,Java在java.net包下提供了Proxy和ProxySelector两个类,其中Proxy代表一个代理服务器,可以在打开URLConnection连接时指定所用的Proxy实例,也可以在创建Socket连接时指定Proxy实例。而ProxySelector代表一个代理选择器,它提供了对代理服务器更加灵活的控制,它可以对HTTP、HTTPS、FTP、SOCKS等分别设置,而且还可以设置不需要通过代理服务器的主机和地址。通过使用ProxySelector可以达到像在Internet Explorer、FireFox等软件中设置代理服务器类似的效果。
代理服务器的功能就是代理网络用户去取得网络信息。我们使用网络浏览器直接连接其他Internet站点取得网络信息时,通常需要发送Request请求来等到响应。代理服务器是介于浏览器和Web服务器之间的一台服务器,有了它之后,浏览器不是直接到Web服务器去取得网页数据而是向代理服务器发出请求,Request请求会先送到代理服务器,由代理服务器来取回浏览器所需要的信息并送回给网络浏览器。而且,大部分代理服务器都具有缓冲的功能,就好像一个大的Cache,它有很大的存储空间,它不断将新取得的数据储存到它本机的存储器上,如果浏览器所请求的数据在它本机的存储器上已经存在而且是最新的,那么它就不重新从Web服务器取数据,而直接将存储器上的数据传送给用户的浏览器,这样就能显著提高浏览速度和效率。归纳起来代理服务器主要提供如下两个功能:
突破自身IP限制,对外隐藏自身IP地址。突破IP限制包括访问国外受限站点,访问国内特定单位、团体的内部资源。
提高访问速度,代理服务器提供的缓冲功能可以避免每个用户都直接访问远程主机,从而提高客户端访问速度。
17.5.1 直接使用Proxy创建连接
Proxy有如下一个构造器:Proxy(Proxy.Type type, SocketAddress sa):创建表示代理服务器的Proxy对象。而sa参数指定代理服务器的地址,其中type是该代理服务器的类型,该服务器类型有如下三种:
Proxy.Type.DIRECT:表示直接连接或缺少代理。
Proxy.Type.HTTP:表示高级协议的代理,如 HTTP 或 FTP.
Proxy.Type.SOCKS:表示 SOCKS(V4 或 V5)代理。
一旦创建了Proxy对象之后,程序就可以在使用URLConnection打开连接时,或创建Socket连接时传入一个Proxy对象,作为本次连接所使用的代理服务器。
其中URL包含了一个URLConnection openConnection(Proxy proxy)方法,该方法使用指定的代理服务器来打开连接;而Socket则提供了一个Socket(Proxy proxy)构造器,该构造器使用指定的代理服务器创建一个没有连接的Socket对象。
下面以URLConnection为例来介绍如何在URLConnection中使用代理服务器。
程序清单:codes/17/17-5/ProxyTest.java
public class ProxyTest
{
Proxy proxy;
URL url;
URLConnection conn;
//从网络通过代理读数据
Scanner scan;
PrintStream ps ;
//下面是代理服务器的地址和端口,
//换成实际有效的代理服务器的地址和端口
String proxyAddress = "202.128.23.32";
int proxyPort;
//下面是你试图打开的网站地址
String urlStr = "http://www.oneedu.cn";
public void init()
{
try
{
url = new URL(urlStr);
//创建一个代理服务器对象
proxy = new Proxy(Proxy.Type.HTTP,
new InetSocketAddress(proxyAddress , proxyPort));
//使用指定的代理服务器打开连接
conn = url.openConnection(proxy);
//设置超时时长。
conn.setConnectTimeout(5000);
scan = new Scanner(conn.getInputStream());
//初始化输出流
ps = new PrintStream("Index.htm");
while (scan.hasNextLine())
{
String line = scan.nextLine();
//在控制台输出网页资源内容
System.out.println(line);
//将网页资源内容输出到指定输出流
ps.println(line);
}
}
catch(MalformedURLException ex)
{
System.out.println(urlStr + "不是有效的网站地址!");
}
catch(IOException ex)
{
ex.printStackTrace();
}
//关闭资源
finally
{
if (ps != null)
{
ps.close();
}
}
}
public static void main(String[] args)
{
new ProxyTest()。init();
}
}
上面代码第一行粗体字代码创建了一个Proxy对象,第二行粗体字代码就是用Proxy对象来打开URLConnection连接。除此之外,该程序的其他地方就是对URLConnection的使用了。由此可见, JDK1.5提供了对代理服务器很好的支持。
直接使用Proxy对象可以在打开URLConnection或Socket时指定代理服务器,使用这种方式需要每次打开连接都显式设置代理服务器。如果想让系统打开连接时总是具有默认的代理服务器,则可以使用java.net.ProxySelector,它可以它根据不同的连接使用不同的代理服务器。
系统默认的ProxySelector会检测各种系统属性和URL协议,然后决定怎样连接不同的主机。当然,程序也可以调用ProxySelector类的setDefaultI()静态方法来设置默认代理服务器,也可以调用getDefault()方法获得系统当前默认的代理服务器。
程序可以通过System类来设置系统的代理服务器属性,关于代理服务器常用的属性名有如下三个:
http.proxyHost:设置HTTP访问所使用的代理服务器地址。该属性名的前缀可以改为https、ftp等,分别用于设置HTTP访问、安全HTTP访问和FTP访问所用的代理服务器地址。
http.proxyPort:设置HTTP访问所使用的代理服务器端口。该属性名的前缀可以改为https、ftp等,分别用于设置HTTP访问、安全HTTP访问和FTP访问所用的代理服务器端口。
http.nonProxyHosts:设置HTTP访问中不需要使用代理服务器的远程主机,可以使用*通配符,如果有多个地址,多个地址用竖线(|)分隔。
下面程序示范了通过改变系统属性来改变默认的代理服务器。
程序清单:codes/17/17-5/ ProxySelectorTest.java
public class ProxySelectorTest
{
//测试本地JVM的网络默认配置
public void setLocalProxy()
{
Properties prop = System.getProperties();
//设置HTTP访问要使用的代理服务器的地址
prop.setProperty("http.proxyHost", "10.10.0.96");
//设置HTTP访问要使用的代理服务器的端口
prop.setProperty("http.proxyPort", "8080");
//设置HTTP访问不需要通过代理服务器访问的主机,
//可以使用*通配符,多个地址用|分隔
prop.setProperty("http.nonProxyHosts", "localhost|10.20.*");
//设置安全HTTP访问使用的代理服务器地址与端口
//它没有https.nonProxyHosts属性,它按照http.nonProxyHosts 中设置的规则访问
prop.setProperty("https.proxyHost", "192.168.0.96");
prop.setProperty("https.proxyPort", "443");
//设置FTP访问的代理服务器的主机、端口以及不需要使用代理服务器的主机
prop.setProperty("ftp.proxyHost", "10.10.0.96");
prop.setProperty("ftp.proxyPort", "2121");
prop.setProperty("ftp.nonProxyHosts", "localhost|10.10.*");
//设置socks代理服务器的地址与端口
prop.setProperty("socks.ProxyHost", "10.10.0.96");
prop.setProperty("socks.ProxyPort", "1080");
}
//清除proxy设置
public void removeLocalProxy()
{
Properties prop = System.getProperties();
//清除HTTP访问的代理服务器设置
prop.remove("http.proxyHost");
prop.remove("http.proxyPort");
prop.remove("http.nonProxyHosts");
//清除HTTPS访问的代理服务器设置
prop.remove("https.proxyHost");
prop.remove("https.proxyPort");
//清除FTP访问的代理服务器设置
prop.remove("ftp.proxyHost");
prop.remove("ftp.proxyPort");
prop.remove("ftp.nonProxyHosts");
//清除SOCKS的代理服务器设置
prop.remove("socksProxyHost");
prop.remove("socksProxyPort");
}
//测试HTTP访问
public void showHttpProxy()
throws MalformedURLException , IOException
{
URL url = new URL("http://www.oneedu.cn");
//直接打开连接,但系统会调用刚设置的HTTP代理服务器
URLConnection conn = url.openConnection(); //①
Scanner scan = new Scanner(conn.getInputStream());
//读取远程主机的内容
while(scan.hasNextLine())
{
System.out.println(scan.nextLine());
}
}
public static void main(String[] args)throws IOException
{
ProxySelectorTest test = new ProxySelectorTest();
test.setLocalProxy();
test.showHttpProxy();
test.removeLocalProxy();
}
}
上面程序中三行粗体字代码设置Java打开HTTP访问时的代理服务器属性,其中前两行代码设置代理服务器的地址和端口,第三行代码设置该代理HTTP访问哪些主机时不需要使用代理服务器。上面程序的①行代码处直接打开一个URLConnection,但系统会为打开该URLConnection时使用代理服务器。
运行上面程序,将会看到程序长时间等待,因为192.168.0.96通常并不是有效的代理服务器(当然,如果读者运行的机器恰好可以使用地址为192.168.0.96的代理服务器又另当别论)。
系统提供了默认的ProxySelector子类作为代理选择器,开发者可以实现自己的代理选择器,程序可以通过继承ProxySelector来实现自己的代理选择器。继承ProxySelector需要重写两个方法:
List<Proxy> select(URI uri):实现该方法让代理选择器根据不同的URI来使用不同的代理服务器,该方法就是代理选择器管理网络连接使用代理服务器的关键。
connectFailed(URI uri, SocketAddress sa, IOException ioe):当系统通过默认的代理服务器建立连接失败后,代理选择器将会自动调用该方法。通过重写该方法可以对连接代理服务器失败的情形进行处理。
系统默认的代理服务器选择器也重写了connectFailed方法,它重写该方法的处理策略是:当系统设置的代理服务器失败时,默认代理选择器将会采用直连的方式连接远程资源,所以当运行上面程序等待了足够长时间时,程序依然可以打印出该远程资源的所有内容。