包含中文字符的URL编码问题

2025-02-23 01:12:33

在xml应用中，经常将一些URL信息作为xml数据存储，其中URL参数有可能包含有中文字符。当使用dom对xml数据进行解析时，可以对中文字符进行编码。
但如果只使用xslt来显示xml数据时(data.xml+data.xsl)，发现此时的URL会出现编码错误.即使指定编码类型(encoding="gb2312"),依然会出现同样的问题.
测试发现：是IE的缓存机制问题，IE仍会把新的页面(所链接的URL)的MIME内容类型默认为text/xml

解决方法：
1.指定输出文档类型为xml文档 (example:data.xsl)
<xsl:output method="xml" encoding="gb2312" media-type="text/xml" />
2.在新的窗口打开，给联接增加属性,指明目标窗口为其他窗口 (example:data2.xsl)
<xsl:attribute name="target">_blank</xsl:attribute>

examples:

/*** data.xml ***/

<?xml version="1.0" encoding="gb2312"?>
<?xml-stylesheet type="text/xsl" href="data.xsl"?>
<root>
<search>
  <url>http://www.google.com/search?q=</url>
  <word>xml数据</word>
</search>
<search>
  <url>http://www1.baidu.com/baidu?word=</url>
  <word>xml数据</word>
</search>
<search>
  <url>http://www.google.com/search?q=</url>
  <word>极限编程(xp)</word>
</search>
<search>
  <url>http://www1.baidu.com/baidu?word=</url>
  <word>极限编程(xp)</word>
</search>
</root>

/*** data.xsl ***/

<?xml version="1.0" encoding="gb2312"?>
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">

<xsl:output method="xml" encoding="gb2312" media-type="text/xml" />

<xsl:template match="/">
<xsl:apply-templates />
</xsl:template>

<xsl:template match="search">
<xsl:element name="a">
<xsl:attribute name="href"><xsl:value-of select="url" /><xsl:value-of select="word" /></xsl:attribute>
<xsl:value-of select="word" />
</xsl:element>
<br />
</xsl:template>

</xsl:stylesheet>

/*** data2.xsl ***/

<?xml version="1.0" encoding="gb2312"?>
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">

<xsl:template match="/">
<xsl:apply-templates />
</xsl:template>

<xsl:template match="search">
<xsl:element name="a">
  <xsl:attribute name="href"><xsl:value-of select="url" /><xsl:value-of select="word" /></xsl:attribute>
  
  <xsl:attribute name="target">_blank</xsl:attribute>
  <xsl:value-of select="word" />
</xsl:element>
<br />
</xsl:template>

</xsl:stylesheet>

包含中文字符的URL编码问题

在xml应用中,经常将一些URL信息作为xml数据存储,其中URL参数有可能包含有中文字符.当使用dom对xml数据进行解析时,可以对中文字符进行编码.但如果只使用xslt来显示xml数据时(data.xml+data.xsl),发现此时的URL会出现编码错误.即使指定编码类型(encoding="gb2312"),依然会出现同样的问题.测试发现:是IE的缓存机制问题,IE仍会把新的页面(所链接的URL)的MIME内容类型默认为text/xml 解决方法:1.指定输出文档类型为xml文
php中解析带中文字符的url函数分享

很多时候,在书写网页应用程序时候,会遇到中文和其他字符冲突的问题,例如有的url链接中包含中文字符,那么在使用wget/curl/file_get_contents等等获取信息时候会直接撞上一个大大的"404",会很无语. 这里写了一个小函数来解决这个问题,只是限于在path中进行解析而已,涉及到的相关函数使用大家可以查看手册就行. 复制代码代码如下: function urlConvert($url){ $pathArr = array();
Lua判断字符串中包含中文字符的方法和计算字符串宽度函数分享

一.判断字符串中包含中文字符的方法遍历数组,对每个字节使用string.byte(),发现有大于127的,就是汉字,可以参照下面的代码. 二.计算字符串宽度函数复制代码代码如下: -- 计算字符串宽度 local str = "Jimmy: 你好,世界!" local fontSize = 20 local lenInByte = #str local width = 0 for i=1,lenInByte do local curByte = string.by
python中文字符如何转url编码

目录如何将中文字符转url编码 python url编码和url解码方法函数介绍编码解码总结如何将中文字符转url编码 import urllib.parse name = urllib.parse.quote('中文') python url编码和url解码方法记录一下用python对文字的url编码和url解码方法,不对基础url编码分析 urllib库是一个python的自带库,使用的时候不需要下载,可以直接导入使用函数介绍函数介绍 urllib.parse.quote
java使用URLDecoder和URLEncoder对中文字符进行编码和解码

摘要: URLDecoder 和 URLEncoder 用于完成普通字符串和 application/x-www-form-urlencoded MIME 字符串之间的相互转换.在本文中,我们以使用URLDecoder解决GET请求中文乱码问题为场景说明 URLDecoder/URLEncoder 的用法,并给出了 application/x-www-form-urlencoded MIME 字符串的编码规则. 一. URLDecoder/URLEncoder 使用场景概述 URLDecode
php中url传递中文字符,特殊危险字符的解决方法

我们需要在url中传递中文字符或是其它的html等特殊字符,似乎总会有各种乱,不同的浏览器对他们的编码又不一样, 对于中文,一般的做法是: 把这些文本字符串传给url之前,先进行urlencode($text)一下: 但是对于一些很"危险"的字符,比如说html字符,甚至是SQL注入相关的字符,如果很明显的传给系统,出于安全考虑,系统一般都会把它们过滤掉的. 现在,我们需要这些危险字符,该这么办? 我想到的办法是先给它们 base64_encode($text) 编码,到服务端时,又
Java 中文字符按Unicode排序的实现方法

遇到了一个对包含中文的字符串进行排序的问题.要求按unicode编码对字符串进行排序. 测试字符串数组如下: String[] arr = { "1-测试", "1-编辑", "1-营销", "1结束", "2-测试", "1-qt" }; 按unicode排序的期望结果应该是这样的: 1-编辑, 1-测试, 1-营销, 1-qt, 1结束, 2-测试先按java.lang.Strin
Java正则表达式判断字符串中是否包含中文示例

前言在日常开发编程中,我们有时从用户那里得到一些输入信息,对于特定应用,部分信息不允许包含中文字符,那如何检测信息字符串中是否包含中文字符呢? 方法有很多,这篇文章就介绍一下如何通过正则表达式来实现这个需求. 示例代码 package cn.sunzn.demo; import java.util.regex.Matcher; import java.util.regex.Pattern; public class Demo { public static void main(String[]
url 编码 js url传参中文乱码解决方案

1.配置文件web.config中在节中加上整个网站的编码方式. <globalization fileEncoding="GB2312" requestEncoding="GB2312" responseEncoding="GB2312"/> 这样参数就以gb2312的中文编码方式传输了.而一般默认是utf-8. 2.在传参是先编码在传输,接受时先编码,在接收. string mm=Server.URLEncode(你); Res
java下载url路径包含中文需要转义的操作

大家看这个url: http://127.0.0.1:9997/file/江苏省地震应急预案(二级).docx 应为url路径中有中文没有转义,输入流报错 The valid characters are defined in RFC 7230 and RFC 398 下面我们对中文路径进行截取转义 int lastIndexOf = downloadUrl.lastIndexOf('/'); String fileName = downloadUrl.substring(lastIndexOf

包含中文字符的URL编码问题

相关推荐

随机推荐