ASP+FSO生成的网页文件默认编码格式以及转换成UTF-8编码方法

具体特征如下:
1、通过模板实现俄文正常。
2、通过后台数据库生成的静态俄文信息,后台显示正常, 前台乱码。
3、英文正常。
和该主题相关的类似或不同表达
FSO写UTF-8编码文件
FSO怎么才能生成utf-8编码的文件
FSO生成的文件默认是什么编码格式
如何转换成UTF-8编码
FSO生成静态网页的问题
ASP中用FSO生成文件代码如下


代码如下:

function createfile(sfilename,scontent)
set fso=server.CreateObject("scripting.filesystemobject")
set f1=fso.opentextfile(sfilename,2,true,-1)
f1.write(scontent)
f1.close
set fso=nothing
end function

fso.opentextfile(sfilename,2,true,-1) 最后一个参数-1是指定编码格式为Unicode,编码格式为Unicode在网页显示的是UTF-16 little-endian。
OpenTextFile方法
创建指定文件并返回TextStream对象,该对象可用于读或写创建的文件。
object.OpenTextFile(filename[, iomode[, create[, format]]])
参数 object,必选项。应为FileSystemObjec或Folder对象的名称。 这里是fso。
filename,必选项。字符串表达式,指明要创建的文件。 这里是sfilename。
iomode,可选参数,表示该文件是被用来读、写还是追加,默认为1表示读,2表示写操作,8表示追加操作。
create,可选参数,如果文件不存在是否创建,默认为false,如果希望进行创建,则设置为true。
format,参数可为下列设置之一,默认为ASCII格式,并没有我们要的utf-8:
TristateUseDefault -2 以系统默认格式打开文件。
TristateTrue -1 以Unicode格式打开文件。
TristateFalse 0 以ASCII格式打开文件。
FSO的编码属性只有三种,系统默认,Unicode,ASCII,并没有我们要的utf-8,所以一般中文系统上使用FSO组件生成的文件都是gb2312编码格式。
解决方法一
GB2312编码包含俄语字母,如果页面设置为简体中文GB2312, 那么俄文能够正常显示, 但由于中文默认“宋体”显示,在 “宋体”中俄语会显示为全角字符,很难看,所以要采用外文字体,如“新罗马”或“Arial”等。中国客户那里可以交差, 但真正的俄国人浏览页面时, 就需要下载和安装中文,很不理想, 很可能导致放弃浏览网页。
解决方法二
ASP由于是一种古老的语言,它的一些功能对UTF-8支持非常差。FSO不支持直接生成UTF-8格式的文件,因为它无法指定需要的文件格式,比如,想生成一个UTF-8格式的文件,使用常用的Scripting.FileSystemObject对象就不行。必须换一种思路,用Adodb.Stream,当前一些blog程序就是这样实现的,如zblog。
Scripting.FileSystemObject 对象创建文件的函数,是下面方式:
FileSystemObject.CreateTextFile(filename[,overwrite[,unicode]])
其中的unicode属性是这样描述的:
可选项。Boolean值指明是否以Unicode或ASCII文件格式创建文件。如果以Unicode文件格式创建文件,则该值为True;如果以ASCII文件格式创建文件,则该值为False。如果省略此部分,则假定创建ASCII文件。
鲜然,无法用这个函数来创建UTF-8格式文件。
使用ADODB.Stream对象,使用方法见下面:


代码如下:

Set objStream = Server.CreateObject("ADODB.Stream")
With objStream
.Open
.Charset = "utf-8"
.Position = objStream.Size
.WriteText=str
.SaveToFile server.mappath("/sitemap.xml"),2
.Close
End With
Set objStream = Nothing

附录:ASCII、Unicode、UTF-8介绍
ASCII是一种字符集,包括大小写的英文字母、数字、控制字符等,它用一个字节表示,范围是0-127。
由于ASCII表示的字符非常有限,各个国家或者地区在此基础上提出了自己的字符集,比如在中国应用非常广泛的GB2312,它为汉字提供了编码,用两个字节表示。
这些字符集之间互不兼容,相同的数字可能表示不同的字符,为信息交流带来了麻烦。
Unicode是一种字符集,它将世界上的所有字符映射成一个唯一的数字(code point),比如字母a对应的数字0x0041。目前Unicode还处于发展中,它所包容的字符越来越多。
在将Unicode表示的字符进行存储时,还需要一定的编码方式,比如UCS-2,它用两个字节来表示Unicode编码的字符。而UTF-8是Unicode字符集的另外一种编码方式,它是变长度的,最多6个字节,小于127的字符用一个字节表示,与ASCII字符集的结果一样,因而具有非常好的兼容性,ASCII编码下的英语文本不需要修改就可以当作UTF-8编码进行处理,应用非常广泛。

(0)

相关推荐

  • 判断网页编码的方法python版

    在web开发的时候我们经常会遇到网页抓取和分析,各种语言都可以完成这个功能.我喜欢用python实现,因为python提供了很多成熟的模块,可以很方便的实现网页抓取. 但是在抓取过程中会遇到编码的问题,那今天我们来看一下如何判断网页的编码: 网上很多网页的编码格式都不一样,大体上是GBK,GB2312,UTF-8等. 我们在获取网页的的数据后,先要对网页的编码进行判断,才能把抓取的内容的编码统一转换为我们能够处理的编码,避免乱码问题的出现. 下面介绍两种判断网页编码的方法: 总结:第二个方法很准

  • js 显示base64编码的二进制流网页图片

    Data URI scheme. Data URI scheme是在RFC2397中定义的,目的是将一些小的数据,直接嵌入到网页中,从而不用再从外部文件载入.比如上面那串字符,其实是一张小图片,将这些字符复制黏贴到火狐的地址栏中并转到,就能看到它了,一张2*2的白色gif图片. 在上面的Data URI中,data表示取得数据的协定名称,image/gif是数据类型名称,base64 是数据的编码方法,逗号后面就是这个image/gif文件base64编码后的数据. 目前,Data URI sc

  • vbs或asp采集文章时网页编码问题

    '/*=========================================================================    ' * Intro       研究网页编码很长时间了,因为最近要设计一个友情链接检测的VBS脚本,而与你链接的人的页面很可能是各种编码,以前采取的方法是:如果用GB2312查不到再用UTF-8查,再找不到证明对方没有给你做链接虽然不是100%正确,但也差不多了,这两种编码用的人比较多,偶然间在收藏夹里的一个地址看到的一个思路,终于可以在

  • asp.net 网页编码自动识别代码

    复制代码 代码如下: using System; using System.Net; using System.Text; using System.Text.RegularExpressions; class Program { // 获取网页的HTML内容,根据网页的charset自动判断Encoding static string GetHtml(string url) { return GetHtml(url, null); } // 获取网页的HTML内容,指定Encoding sta

  • Base64编码加密JS代码网页版

    你可将本页保存后上传到你的网站中,这样你就拥有了一个Base64编码加密.解密的功能页面,让需要的用户去访问你的网页. Base64编码加密 BODY { MARGIN-TOP: 0px; FONT-SIZE: 9pt; MARGIN-LEFT: 0px; MARGIN-RIGHT: 0px; FONT-FAMILY: "宋体" } A { FONT-WEIGHT: 400; FONT-SIZE: 9pt; COLOR: black; TEXT-DECORATION: none } A

  • 多种语言(big5\gbk\gb2312\utf8\Shift_JIS\iso8859-1)的网页编码切换解决方案归纳

    1.response.setContentType("text/html; charset=GB2312"); 或者response.setContentType("text/html; charset=UTF-8"); charset前面留一个空格 2.头文件包含 3. 一般处理是将在网页上提交的中文转码为Unicode存储在数据库中,取出来的 时候,用自动转码(ContentType="text/html;charset=gb2312"或Co

  • 网页语言编码及asp乱码问题解决方案

    最近公司有一个日文项目,由于之前使用的是自己开发的中文CMS,并没有将语言包分离,在网站建设调试过程中出现了令人头疼的乱码问题. 乱码出现的原因 由于各个字符编码的储存空间不一样,所以当使用不同的字符读取数据时,当字符空间过小,就不能正常显示了. 比如说中文字符的字符集一般是gb2312,如果用utf-8强制读取改变gb2312的字符,就有可能出现乱码.因为utf-8的字符集储存空间大于gb2312,当使用utf-8读取时,有些字符gb2312的编码中是不存在的,不存在的字符自然会出现乱码了.对

  • ASP UTF-8编码生成静态网页的函数

    以下函数采用FSO对象,文件位置在FSO.ASP.FSO对象的文件编码属性只有三种,系统默认,Unicode,ASCII,并没有我们要的utf-8,所以一般中文系统上使用FSO对象生成的文件都是gb2312网页编码格式,无法生成UTF-8编码,因此,英文等拉丁语系和中文可以正常显示,但象俄语等非拉丁语系,页面就会出现乱码. 复制代码 代码如下: function createfile(sfilename,scontent) set fso=server.CreateObject("scripti

  • php 判断网页是否是utf8编码的方法

    //判断编码 复制代码 代码如下: $encode = mb_detect_encoding($q, array('GB2312','GBK','UTF-8'));echo $encode."<br/>";if($encode=="GB2312"){    $q = iconv("GBK","UTF-8",$q);}else if($encode=="GBK"){    $q = iconv(&

  • asp.net HttpWebRequest自动识别网页编码

    复制代码 代码如下: static string GetEncoding(string url) { HttpWebRequest request = null; HttpWebResponse response = null; StreamReader reader = null; try { request = (HttpWebRequest)WebRequest.Create(url); request.Timeout = 20000; request.AllowAutoRedirect

随机推荐