url编码对照表,URL编码表
关于url编码标准的说明
对字符串中除了 -_. 三个字符之外的所有非字母数字字符都替换成百分号(%)后跟两位十六进制数。
RFC-3986 中采用统一的编码方式,字符的编码格式为:%HH(H为十六进制字符), 并没有对空格做特殊处理。按照 RFC-3986 规范,空格被编码成%20,而加号"+"被编码成%2B。
编码方式是根据ContextType的不同而区别对待的,在form的ContextType是[x-www-form-urlencoded]的时候会对form中的键/值对进行编码,空格被转义成+,其他字符按照 RFC1738 标准处理成%HH的形式。
返回字符串,此字符串中除了 -_. 之外的所有非字母数字字符都将被替换成百分号( % )后跟两位十六进制数,空格则编码为加号( + )。此编码与 WWW 表单 POST 数据的编码方式是一样的,同时与 application/x-www-form-urlencoded 的媒体类型编码方式一样。由于历史原因,此编码在将空格编码为加号(+)方面与 ? RFC3986 编码(参见 rawurlencode() )不同。
url的编码和解码方式
url的在线编码和解码工具:
1、基本知识
URLEncode:是指针对网页url中的中文字符的一种编码转化方式,最常见的就是Baidu、 Google等搜索引擎中输入中文查询时候,生成经过 Encode过的网页URL。URLEncode的方式一般有两种一种是传统的基于GB2312的Encode(Baidu、Yisou等使用),一种是 基于UTF-8的Encode(Google,Yahoo等使用)。本工具分别实现两种方式的Encode与Decode。
中文 - GB2312的Encode - ????
中文 - UTF-8的Encode - 中文
Html中的URLEncode:
编码为GB2312的html文件中,
中文.rar - 浏览器自动转换为 - ????.rar
注意:Firefox对GB2312的Encode的中文URL支持不好,因为它默认是UTF-8编码发送URL的,但是ftp://协议可以,我试过了.我认为这应该算是Firefox一个bug.
编码为UTF-8的html文件中,
中文.rar - 浏览器自动转换为 - 中文.rar
PHP中的URLEncode:
//GB2312的Encode
echo urlencode(“中文-_. “).”\n”; // ????-_.+
echo urldecode(“????-_. “).”\n”; //中文-_.
echo rawurlencode(“中文-_. “).”\n”; // ????-_.
echo rawurldecode(“????-_. “).”\n”; //中文-_.
?
除了 -_. 之外的所有非字母数字字符都将被替换成百分号(%)后跟两位十六进制数。
urlencode和rawurlencode的区别:
urlencode 将空格则编码为加号(+)
rawurlencode 将空格则编码为加号( )
如果要使用UTF-8的Encode,有两种方法:
一、将文件存为UTF-8文件,直接使用urlencode、rawurlencode即可。
二、使用mb_convert_encoding函数。
$url = ‘中文.rar’;
echo urlencode(mb_convert_encoding($url, ‘utf-8′, ‘gb2312′)).”\n”;
echo rawurlencode(mb_convert_encoding($url, ‘utf-8′, ‘gb2312′)).”\n”;
//中文.rar
?
实例:
function parseurl($url=”")
{
$url = rawurlencode(mb_convert_encoding($url, ‘gb2312′, ‘utf-8′));
$a = array(“:”, “/”, “@″);
$b = array(“:”, “/”, “@”);
$url = str_replace($a, $b, $url);
return $url;
}
$url=”中文/中文.rar”;
echo parseurl($url);
//????/????.rar
?
JavaScript中的URLEncode:
中文-_. 中文-_.
encodeURI 不对下列字符进行编码:“:”、“/”、“;”、“?”、“@”等特殊字符。
中文.rar中文.rar
2、示例
;ckn=91142321196129
1)utf-8解码
?????? ??????ckn=91142321196129
2)gb2312解码
?针吠塑? 浈??