Java之旅_高级教程_URL处理
摘自 :http://www.runoob.com/java/java-url-processing.html
Java URL 处理
URL(Uniform Resource Locator)中文名为统一资源定位符,有时也被俗称为网页地址。表示为互联网上的资源,如网页或者FTP地址。
本章节我们将介绍Java是如何处理URL的。URL可以分为如下几个部分。
protocol://host:port/path?query#fragment
protocol(协议)可以是HTTP、HTTPS、FTP和File, port为端口号,path为文件路径及文件名。
HTTP协议的URL实例如下:
http://www.runoob.com/index.html?language=cn#j2se
URL解析:
- 协议(protocol):http
- 主机(host:port):www.runoob.com
- 端口号(port):80,以上URL并未指定端口,因为 HTTP 协议的默认端口是80
- 文件路径(path):/index.html
- 请求参数(query):language=cn
- 定位位置(fragment):j2se, 定位到网页中 id 属性为 j2se 的 HTML 元素位置
URL类方法 :
在 java.net 包中定义了 URL 类,该类用来处理有关 URL 的内容。对于 URL 类的创建和使用,下面分别进行介绍。
java.net.URL 构造方法:
序号 | 方法描述 |
1 |
public URL(String protocol,String host,int port,String file)throws MalformedURLException 通过给定的参数(协议、主机名、端口号、文件名)创建URL |
2 |
public URL(String protocal,String host,String file) throws MalformedURLException 使用给定的参数(协议,主机名,文件名)创建URL,端口号使用默认80 |
3 |
public URL(String url)throws MalformedURLException 通过给定的字符串创建URL |
4 |
public URL(URL context,String url)throws MalformedURLException 使用基地址和相对URL创建 |
URL类中包含了很多方法用于访问URL的各个部分,具体方法及描述如下 :
序号 | 方法 | 描述 |
1 |
public String getPath() |
返回URL路径部分 |
2 | public String getQuery() | 返回URL查询部分 |
3 | public String getAuthority() | 获取此URL授权部分 |
4 | public int getPort() | 返回URL端口部分 |
5 | public int getDefaultPort() | 返回协议的默认端口号 |
6 | public String getProtocol() | 返回URL的协议 |
7 | public String getHost() | 返回URL的主机 |
8 | public String getFile() | 返回URL文件名部分 |
9 | public String getRef() | 返回URL的锚点(也称为“引用 ”) |
10 |
public URLConnection openConnection() throws IOException |
打开一个URL连接,并运行客户端访问资源 |
实例
以下实例演示了使用java.net的URL类获取URL的各个部分参数:
import java.net.*; import java.io.*; public class URLDemo { public static void main(String [] args) { try { URL url = new URL("http://www.runoob.com/index.html?language=cn#j2se"); System.out.println("URL 为:" + url.toString()); System.out.println("协议为:" + url.getProtocol()); System.out.println("验证信息:" + url.getAuthority()); System.out.println("文件名及请求参数:" + url.getFile()); System.out.println("主机名:" + url.getHost()); System.out.println("路径:" + url.getPath()); System.out.println("端口:" + url.getPort()); System.out.println("默认端口:" + url.getDefaultPort()); System.out.println("请求参数:" + url.getQuery()); System.out.println("定位位置:" + url.getRef()); }catch(IOException e) { e.printStackTrace(); } } }
URLConnections 类方法
openConnection() 返回一个 java.net.URLConnection。
例如:
-
如果你连接HTTP协议的URL, openConnection() 方法返回 HttpURLConnection 对象。
-
如果你连接的URL为一个 JAR 文件, openConnection() 方法将返回 JarURLConnection 对象。
-
等等...
URLConnection 方法列表如下:
序号 | 方法描述 |
---|---|
1 | Object getContent() 检索URL链接内容 |
2 | Object getContent(Class[] classes) 检索URL链接内容 |
3 | String getContentEncoding() 返回头部 content-encoding 字段值。 |
4 | int getContentLength() 返回头部 content-length字段值 |
5 | String getContentType() 返回头部 content-type 字段值 |
6 | int getLastModified() 返回头部 last-modified 字段值。 |
7 | long getExpiration() 返回头部 expires 字段值。 |
8 | long getIfModifiedSince() 返回对象的 ifModifiedSince 字段值。 |
9 | public void setDoInput(boolean input) URL 连接可用于输入和/或输出。如果打算使用 URL 连接进行输入,则将 DoInput 标志设置为 true;如果不打算使用,则设置为 false。默认值为 true。 |
10 | public void setDoOutput(boolean output) URL 连接可用于输入和/或输出。如果打算使用 URL 连接进行输出,则将 DoOutput 标志设置为 true;如果不打算使用,则设置为 false。默认值为 false。 |
11 | public InputStream getInputStream() throws IOException 返回URL的输入流,用于读取资源 |
12 | public OutputStream getOutputStream() throws IOException 返回URL的输出流, 用于写入资源。 |
13 | public URL getURL() 返回 URLConnection 对象连接的URL |
实例
以下实例中URL采用了HTTP 协议。 openConnection 返回HttpURLConnection对象。
import java.net.*; import java.io.*; public class URLConnDemo { public static void main(String [] args) { try { URL url = new URL("http://www.runoob.com"); URLConnection urlConnection = url.openConnection(); HttpURLConnection connection = null; if(urlConnection instanceof HttpURLConnection) { connection = (HttpURLConnection) urlConnection; } else { System.out.println("请输入 URL 地址"); return; } BufferedReader in = new BufferedReader( new InputStreamReader(connection.getInputStream())); String urlString = ""; String current; while((current = in.readLine()) != null) { urlString += current; } System.out.println(urlString); }catch(IOException e) { e.printStackTrace(); } } }