java中的URLEncoder和URLDecoder类

资源描述

《java中的URLEncoder和URLDecoder类》由会员分享，可在线阅读，更多相关《java中的URLEncoder和URLDecoder类（8页珍藏版）》请在金锄头文库上搜索。

1、/*网页中的表单使用 POST方法提交时，数据内容的类型是 application/x-www-form-urlencoded，这种类型会：1.字符a-z，A-Z，0-9，.，-，*，和_ 都不会被编码;2.将空格转换为加号 (+) ;3.将非文本内容转换成%xy的形式,xy 是两位 16进制的数值;4.在每个 name=value 对之间放置 & 符号。*/URLEncoder 类包含将字符串转换为 application/x-www-form-urlencoded MIME 格式的静态方法。web 设计者面临的众多难题之一便是怎样处理不同操作系统间的差异性。这些差异性能引起 URL方面的问

2、题：例如，一些操作系统允许文件名中含有空格符，有些又不允许。大多数操作系统不会认为文件名中含有符号“#”会有什么特殊含义;但是在一个 URL中，符号“#”表示该文件名已经结束，后面会紧跟一个 fragment(部分)标识符。其他的特殊字符，非字母数字字符集，它们在 URL或另一个操作系统上都有其特殊的含义，表述着相似的问题。为了解决这些问题，我们在 URL中使用的字符就必须是一个 ASCII字符集的固定字集中的元素，具体如下：1.大写字母 A-Z2.小写字母 a-z3.数字 0-94.标点符 - _ . ! * (和 ,)诸如字符: / & ? # ; $ + = 和 %也可以被使用，但是它们

3、各有其特殊的用途，如果一个文件名包括了这些字符( / & ? # ; $ + = %)，这些字符和所有其他字符就应该被编码。编码过程非常简单，任何字符只要不是 ASCII码数字，字母，或者前面提到的标点符，它们都将被转换成字节形式，每个字节都写成这种形式：一个“%”后面跟着两位 16进制的数值。空格是一个特殊情况，因为它们太平常了。它除了被编码成“%20”以外，还能编码为一个“+”。加号(+)本身被编码为%2B。当/ # = & 和?作为名字的一部分来使用时，而不是作为 URL部分之间的分隔符来使用时，它们都应该被编码。WARNING 这种策略在存在大量字符集的异构环境中效果不甚理想。例如：在

4、 U.S. Windows 系统中, 被编码为 %E9. 在 U.S. Mac 中被编码为%8E。这种不确定性的存在是现存的 URI的一个明显的不足。所以在将来 URI的规范当中应该通过国际资源标识符(IRIs)进行改善。类 URL并不自动执行编码或解码工作。你能生成一个 URL对象，它可以包括非法的ASCII和非 ASCII字符和/或%xx。当用方法 getPath() 和 toExternalForm( ) 作为输出方法时，这种字符和转移符不会自动编码或解码。你应对被用来生成一个 URL对象的字符串对象负责，确保所有字符都会被恰当地编码。幸运的是，java 提供了一个类 URLEncode

5、r把 string编码成这种形式。Java1.2 增加了一个类 URLDecoder它能以这种形式解码 string。这两个类都不用初始化：public class URLDecoder extends Objectpublic class URLEncoder extends Object一、URLEncoder在 java1.3和早期版本中，类 .URLEncoder包括一个简单的静态方法encode( )，它对 string以如下规则进行编码：public static String encode(String s)这个方法总是用它所在平台的默认编码形式，所以在不同系统上，它就会产生不

6、同的结果。结果 java1.4中，这个方法被另一种方法取代了。该方法要求你自己指定编码形式：public static String encode(String s, String encoding) throws UnsupportedEncodingException两种关于编码的方法，都把任何非字母数字字符转换成%xx(除了空格，下划线(_)，连字符(?),句号(。),和星号(*)。两者也都编码所以的非 ASCII字符。空格被转换成一个加号。这些方法有一点过分累赘了;它们也把“”，“”，“()”转换成%xx，即使它们完全用不着这样做。尽管这样，但是这种转换并没被 URL规范所禁止。所以

7、web浏览器会自然地处理这些被过分编码后的 URL。两中关于编码的方法都返回一个新的被编码后的 string，java1.3 的方法 encode( ) 使用了平台的默认编码形式，得到%xx。这些编码形式典型的有：在 U.S. Unix 系统上的ISO-8859-1, 在 U.S. Windows 系统上的 Cp1252,在 U.S. Macs上的 MacRoman，和其他本地字符集等。因为编码解码过程都是与本地操作平台相关的，所以这些方法是令人不爽的，不能跨平台的。这就明确地回答了为什么在 java1.4中这种方法被抛弃了，转而投向了要求以自己指定编码形式的这种方法。尽管如此，如果你执意要使

8、用所在平台的默认编码形式，你的程序将会像在 java1.3中的程序一样，是本地平台相关的。在另一种编码的方法中，你应该总是用 UTF-8，而不是其他什么。UTF-8 比起你选的其他的编码形式来说，它能与新的 web浏览器和更多的其他软件相兼容。例子 7-8是使用 URLEncoder.encode( ) 来打印输出各种被编码后的 string。它需要在 java1.4或更新的版本中编译和运行。Example 7-8. x-www-form-urlencoded stringsimport .URLEncoder;import .URLDecoder;import java.io.Unsuppo

9、rtedEncodingException;public class EncoderTest public static void main(String args) try System.out.println(URLEncoder.encode(This string has spaces,UTF-8);System.out.println(URLEncoder.encode(This*string*has*asterisks,UTF-8);System.out.println(URLEncoder.encode(This%string%has%percent%signs, UTF-8);

10、System.out.println(URLEncoder.encode(This+string+has+pluses,UTF-8);System.out.println(URLEncoder.encode(This/string/has/slashes,UTF-8);System.out.println(URLEncoder.encode(Thisstringhasquotemarks, UTF-8);System.out.println(URLEncoder.encode(This:string:has:colons,UTF-8);System.out.println(URLEncoder

11、.encode(Thisstringhastildes,UTF-8);System.out.println(URLEncoder.encode(This(string)has(parentheses), UTF-8);System.out.println(URLEncoder.encode(This.string.has.periods,UTF-8);System.out.println(URLEncoder.encode(This=string=has=equals=signs, UTF-8);System.out.println(URLEncoder.encode(This&string&

12、has&ersands,UTF-8);System.out.println(URLEncoder.encode(Thisstringhas non-ASCII characters,UTF-8);/ System.out.println(URLEncoder.encode(this 中华人民共和国,UTF-8); catch (UnsupportedEncodingException ex) throw new RuntimeException(Broken VM does not support UTF-8);下面就是它的输出。需要注意的是这些代码应该以其他编码形式被保存而不是以ASCII码

13、的形式，还有就是你选择的编码形式应该作为一个参数传给编译器，让编译器能据此对源代码中的非 ASCII字符作出正确的解释。% javac -encoding UTF8 EncoderTest %java EncoderTestThis+string+has+spacesThis*string*has*asterisksThis%25string%25has%25percent%25signsThis%2Bstring%2Bhas%2BplusesThis%2Fstring%2Fhas%2FslashesThis%22string%22has%22quote%22marksThis%3Astrin

14、g%3Ahas%3AcolonsThis%7Estring%7Ehas%7EtildesThis%28string%29has%28parentheses%29This.string.has.periodsThis%3Dstring%3Dhas%3Dequals%3DsignsThis%26string%26has%26ampersandsThis%C3%A9string%C3%A9has%C3%A9non-ASCII+characters特别需要注意的是这个方法编码了符号，“” ,&,=,和：。它不会尝试着去规定在一个 URL中这些字符怎样被使用。由此，所以你不得不分块编码你的 URL,而不

15、是把整个 URL一次传给这个方法。这是很重要的，因为对类 URLEncoder最通常的用法就是查询string，为了和服务器端使用 GET方法的程序进行交互。例如，假设你想编码这个查询sting，它用来搜索 AltaVista网站：pg=q&kl=XX&stype=stext&q=+Java+I/O&search.x=38&search.y=3这段代码对其进行编码：String query = URLEncoder.encode( pg=q&kl=XX&stype=stext&q=+Java+I/O&search.x=38&search.y=3);System.out.println(quer

16、y);不幸的是，得到的输出是:pg%3Dq%26kl%3DXX%26stype%3Dstext%26q%3D%2B%22Java%2BI%2FO%22%26search.x%3D38%26search.y%3D3出现这个问题就是方法 URLEncoder.encode( ) 在进行盲目地编码。它不能区分在 URL或者查询 string中被用到的特殊字符(象前面 string中的“=”，和“&”)和确实需要被编码的字符。由此，所以 URL需要像下面这样一次只编码一块：String query = URLEncoder.encode(pg);query += =;query += URLEncoder.encode(

展开阅读全文

java中的URLEncoder和URLDecoder类

最新文档