在服务器端的XSLT过程中的编码问题

最近和苹果皮在讨论优化 Weather For Google Earth 的时候使用到了 XSLT 来转换 XML 数据的问题,那这里就必须用到转换引擎,大概过程就是把 XML 文件和 XSLT 文件都转载到内存里用DOM引擎进行转换到我们想要的 HTML(我这个实例里是要生成 KML 文件)。这个转换的过程又分客户端和服务器端的,因为客户端的转换需要用户的浏览器完整地支持 XML ,但不是全部的用户的浏览器现在都支持的(IE5、IE4等),所以进行服务端的转换是比较理想的。
    XML文件形式:

<?xml version="1.0" encoding="UTF-8"?>
<weather ver="2.0">
  <head>[...]
  </head>
  <loc id="CHXX0101">[...]  
  </loc>  
  <cc>[...]  
  </cc>  
  <dayf>  
    <lsup>10/28/06 11:16 AM Local Time</lsup>  
    <day d="0" t="Saturday" dt="Oct 28">[...]  
    </day>  
    <day d="1" t="Sunday" dt="Oct 29">[...]  
    </day>  
  </dayf> 
</weather> 
    XSLT文件形式(内容部分省略):

<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
    <xsl:output method="xml" version="1.0" encoding="UTF-8" indent="yes"/>
    <xsl:template match="/">[...]
</xsl:stylesheet>

我开始进行的转换代码,用的是ASP+JavaScirpt :

//========输出类型和流编码==========================
      Response.ContentType = "application/vnd.google-earth.kml+xml";
      Response.CharSet = "UTF-8" ;
//=====获得并载入远程XML文件==========================
      var oXHy = Server.CreateObject("MSXML2.XMLHTTP");
      var url  = http://www.dnxh.cn/ge/CHXX0101.xml;  
      oXHy.open("GET",url,false);
      oXHy.send();
      var oXD = Server.CreateObject("MSXML2.DOMDocument");
      oXD.loadXML(oXHy.responseText);
//======载入XSL文件=========================
      var xsl = Server.CreateObject("Microsoft.XMLDOM");
      xsl.async = false;
      xsl.load(Server.MapPath("gew.xsl"));
//======文件的转换====================
      Response.Write(oXD.transformNode(xsl)); 
    按理说这样应该没有编码的问题了,因为该声明编码的地方都声明了。可是偏偏出了问题。输出的 KML 文件的开头声明里面总是
  <?xml version="1.0" encoding="UTF-16"?>
  通过测试发现 XML 和 XSLT 两个源文件没有问题,那问题就在 ASP 代码里的转换引擎上,后来在RE: [xsl] Problem with Chinese (Solution)这篇文章上大概的找到了原因,这里面说引擎 transformNode 是生成了一个字符串,而在 win32 平台上总是以 UTF-16 来处理字符串的,然后我们再用这个字符串来生成 KML 文件,那结果就只能是 UTF-16 的了。
    解决的办法就是用 transformNodeToObject 引擎。文件转换部分换成 oXD.transformNodeToObject( xsl , Response)。这两个方法的不同之处就是前一个是生成了一个字符串变量,后一个是直接把转换后的 XML 数据保存到指定的节点里了。

(0)

相关推荐

  • 在服务器端的XSLT过程中的编码问题

    最近和苹果皮在讨论优化 Weather For Google Earth 的时候使用到了 XSLT 来转换 XML 数据的问题,那这里就必须用到转换引擎,大概过程就是把 XML 文件和 XSLT 文件都转载到内存里用DOM引擎进行转换到我们想要的 HTML(我这个实例里是要生成 KML 文件).这个转换的过程又分客户端和服务器端的,因为客户端的转换需要用户的浏览器完整地支持 XML ,但不是全部的用户的浏览器现在都支持的(IE5.IE4等),所以进行服务端的转换是比较理想的.     XML文件

  • Python结巴中文分词工具使用过程中遇到的问题及解决方法

    本文实例讲述了Python结巴中文分词工具使用过程中遇到的问题及解决方法.分享给大家供大家参考,具体如下: 结巴分词是Python语言中效果最好的分词工具,其功能包括:分词.词性标注.关键词抽取.支持用户词表等.这几天一直在研究这个工具,在安装与使用过程中遇到一些问题,现在把自己的一些方法帖出来分享一下. 官网地址:https://github.com/fxsjy/jieba 1.安装. 按照官网上的说法,有三种安装方式, 第一种是全自动安装:easy_install jieba 或者 pip

  • mysql数据校验过程中的字符集问题处理

    场景:主库DB:utf8字符集备库DB:gbk字符集 需求:校验主备数据是否一致,并且修复 校验过程:设置主库连接为utf8,设置备库连接为gbk,分别进行查询,将返回的的结果集按记录逐字段比较. 显示结果:原本相同的汉字字符,数据校验认为不一致. 原因分析:对于主库而已,由于建立连接的字符集为UTF8,则返回的汉字字符编码为UTF8格式:对于备库而言则是GBK格式,而程序中通过字符串比较函数strcasecmp进行比较,显然不同的字符集编码,相同的字符有不同的二进制,因此结果肯定不会相等. 进

  • PHP也能干大事之PHP中的编码解码详解

    写在前面 PHP也能干大事是我总结的PHP语法特性及相关函数类库的经典用法,并不一定是真正能实现四两拨千斤的功效,但是掌握这些方法,可以在你的工作和学习上有一些帮助,希望大家能集思广益,将<PHP也能干大事>丰富得更精彩!转载请注明出处(jb51.net) 二.前言 PHP是常见的脚本语言,主要是因为其简单易学,上手快,几乎50%以上的Web程序都有PHP的身影(不完全统计).PHP为开发这提供了丰富的函数和API接口,这使得我们能够非常方便地使用其强大的内置函数及扩展,本文是<PHP也

  • PHP与MYSQL中UTF8编码的中文排序实例

    本文实例讲述了PHP与MYSQL中UTF8编码的中文排序方法,分享给大家供大家参考.具体实现方法如下: 一般来说,中文共有三种排序方式: 1.根据拼音排序: 2.根据笔画排序: 3.根据偏旁排序. 系统的默认排序方式为拼音排序了,这个也是我们常用的,下面介绍的就是按拼音排序了 1. 需要在php数组中用中文排序,但是一般使用utf8格式的文件,直接用asort排序不行.用gbk和gb2312可以.这跟几种格式的编码有关系.gbk和gb2312本身的编码就是用拼音排序的. 复制代码 代码如下: f

  • 在DW中CSS编码需要注意和掌握的一些技巧

    由于"可视化"和操作简便,在DW中编写CSS的朋友很多,今天我们介绍一些在DW中编写CSS的"最佳习惯",希望对大家有所帮助. CSS正在改变网站设计的进程.为迎合不断增长的倾向于CSS的设计人员的需求,Macromedia DW MX引进了一些新的及改善过的CSS相关的特性.有了这些新的特性,你可以为未来的更新作好计划,开发与W3C标准更加兼容的站点.本文讨论在DW MX中使用CSS以及突出某一特定CSS特性时的一些建议. 一般地讲,样式表(style sheet

  • 深入解析Java中的编码转换以及编码和解码操作

    一.Java编码转换过程  我们总是用一个java类文件和用户进行最直接的交互(输入.输出),这些交互内容包含的文字可能会包含中文.无论这些java类是与数据库交互,还是与前端页面交互,他们的生命周期总是这样的:  (1).程序员在操作系统上通过编辑器编写程序代码并且以.java的格式保存操作系统中,这些文件我们称之为源文件.  (2).通过JDK中的javac.exe编译这些源文件形成.class类.  (3).直接运行这些类或者部署在WEB容器中运行,得到输出结果.  这些过程是从宏观上面来

  • 解决Mysql 8.0.17 winx64版本安装过程中遇到的问题

    一.手动创建添加my.ini文件 # CLIENT SECTION # ---------------------------------------------------------------------- # # The following options will be read by MySQL client applications. # Note that only client applications shipped by MySQL are guaranteed # to

  • 彻彻底底地理解Python中的编码问题

    Python处理文本的功能非常强大,但是如果是初学者,没有搞清楚python中的编码机制,也经常会遇到乱码或者decode error.本文的目的是简明扼要地说明python的编码机制,并给出一些建议. 问题1:问题在哪里? 问题是我们的靶子,心中没有问题去学习就会抓不住重点. 本文使用的编程环境是centos6.7,python2.7.我们在shell中键入python以打开python命令行,并键入如下两句话: s = "中国zg" e = s.encode("utf-8

  • java中Base64编码原理实例讲解

    什么是 Base64 编码 Base64 编码是最常见的编码方式,基于 64 个可打印字符来表示任意二进制数据的方法,是从二进制转换到可见字符的过程. 使用场景 数据加密或签名通过 Base64 转换为字符串存储或传输. 不能传输文件的网络环境可以转换 Base64 进行网络传输. 在文本资源(如 HTML 和 CSS文件)中嵌入图片文件或其他二进制资源. 在 URL.网页中传输少量二进制数据等等. Base64 编码原理 原理是把每 3 个字节(每个字节为 8 位, 3 个字节为 24 位)重

随机推荐