ASP+FSO生成的网页文件默认编码格式以及转换成UTF-8编码方法

2024-12-22 01:23:46

具体特征如下：
1、通过模板实现俄文正常。
2、通过后台数据库生成的静态俄文信息，后台显示正常，前台乱码。
3、英文正常。
和该主题相关的类似或不同表达
FSO写UTF-8编码文件
FSO怎么才能生成utf-8编码的文件
FSO生成的文件默认是什么编码格式
如何转换成UTF-8编码
FSO生成静态网页的问题
ASP中用FSO生成文件代码如下

代码如下:

function createfile(sfilename,scontent)
set fso=server.CreateObject("scripting.filesystemobject")
set f1=fso.opentextfile(sfilename,2,true,-1)
f1.write(scontent)
f1.close
set fso=nothing
end function

fso.opentextfile(sfilename,2,true,-1) 最后一个参数-1是指定编码格式为Unicode，编码格式为Unicode在网页显示的是UTF-16 little-endian。
OpenTextFile方法
创建指定文件并返回TextStream对象，该对象可用于读或写创建的文件。
object.OpenTextFile(filename[, iomode[, create[, format]]])
参数 object，必选项。应为FileSystemObjec或Folder对象的名称。这里是fso。
filename，必选项。字符串表达式，指明要创建的文件。这里是sfilename。
iomode，可选参数，表示该文件是被用来读、写还是追加，默认为1表示读，2表示写操作，8表示追加操作。
create，可选参数，如果文件不存在是否创建，默认为false，如果希望进行创建，则设置为true。
format，参数可为下列设置之一，默认为ASCII格式，并没有我们要的utf-8：
TristateUseDefault -2 以系统默认格式打开文件。
TristateTrue -1 以Unicode格式打开文件。
TristateFalse 0 以ASCII格式打开文件。
FSO的编码属性只有三种，系统默认，Unicode，ASCII，并没有我们要的utf-8，所以一般中文系统上使用FSO组件生成的文件都是gb2312编码格式。
解决方法一
GB2312编码包含俄语字母，如果页面设置为简体中文GB2312，那么俄文能够正常显示，但由于中文默认“宋体”显示，在 “宋体”中俄语会显示为全角字符，很难看，所以要采用外文字体，如“新罗马”或“Arial”等。中国客户那里可以交差，但真正的俄国人浏览页面时，就需要下载和安装中文，很不理想，很可能导致放弃浏览网页。
解决方法二
ASP由于是一种古老的语言，它的一些功能对UTF-8支持非常差。FSO不支持直接生成UTF-8格式的文件，因为它无法指定需要的文件格式，比如，想生成一个UTF-8格式的文件，使用常用的Scripting.FileSystemObject对象就不行。必须换一种思路，用Adodb.Stream，当前一些blog程序就是这样实现的，如zblog。
Scripting.FileSystemObject 对象创建文件的函数，是下面方式：
FileSystemObject.CreateTextFile(filename[,overwrite[,unicode]])
其中的unicode属性是这样描述的：
可选项。Boolean值指明是否以Unicode或ASCII文件格式创建文件。如果以Unicode文件格式创建文件，则该值为True；如果以ASCII文件格式创建文件，则该值为False。如果省略此部分，则假定创建ASCII文件。
鲜然，无法用这个函数来创建UTF-8格式文件。
使用ADODB.Stream对象，使用方法见下面：

代码如下:

Set objStream = Server.CreateObject("ADODB.Stream")
With objStream
.Open
.Charset = "utf-8"
.Position = objStream.Size
.WriteText=str
.SaveToFile server.mappath("/sitemap.xml"),2
.Close
End With
Set objStream = Nothing

附录：ASCII、Unicode、UTF-8介绍
ASCII是一种字符集，包括大小写的英文字母、数字、控制字符等，它用一个字节表示，范围是0-127。
由于ASCII表示的字符非常有限，各个国家或者地区在此基础上提出了自己的字符集，比如在中国应用非常广泛的GB2312，它为汉字提供了编码，用两个字节表示。
这些字符集之间互不兼容，相同的数字可能表示不同的字符，为信息交流带来了麻烦。
Unicode是一种字符集，它将世界上的所有字符映射成一个唯一的数字(code point)，比如字母a对应的数字0x0041。目前Unicode还处于发展中，它所包容的字符越来越多。
在将Unicode表示的字符进行存储时，还需要一定的编码方式，比如UCS-2，它用两个字节来表示Unicode编码的字符。而UTF-8是Unicode字符集的另外一种编码方式，它是变长度的，最多6个字节，小于127的字符用一个字节表示，与ASCII字符集的结果一样，因而具有非常好的兼容性，ASCII编码下的英语文本不需要修改就可以当作UTF-8编码进行处理，应用非常广泛。

php 判断网页是否是utf8编码的方法

//判断编码复制代码代码如下: $encode = mb_detect_encoding($q, array('GB2312','GBK','UTF-8'));echo $encode."<br/>";if($encode=="GB2312"){ $q = iconv("GBK","UTF-8",$q);}else if($encode=="GBK"){ $q = iconv(&
vbs或asp采集文章时网页编码问题

'/*========================================================================= ' * Intro 研究网页编码很长时间了,因为最近要设计一个友情链接检测的VBS脚本,而与你链接的人的页面很可能是各种编码,以前采取的方法是:如果用GB2312查不到再用UTF-8查,再找不到证明对方没有给你做链接虽然不是100%正确,但也差不多了,这两种编码用的人比较多,偶然间在收藏夹里的一个地址看到的一个思路,终于可以在
判断网页编码的方法python版

在web开发的时候我们经常会遇到网页抓取和分析,各种语言都可以完成这个功能.我喜欢用python实现,因为python提供了很多成熟的模块,可以很方便的实现网页抓取. 但是在抓取过程中会遇到编码的问题,那今天我们来看一下如何判断网页的编码: 网上很多网页的编码格式都不一样,大体上是GBK,GB2312,UTF-8等. 我们在获取网页的的数据后,先要对网页的编码进行判断,才能把抓取的内容的编码统一转换为我们能够处理的编码,避免乱码问题的出现. 下面介绍两种判断网页编码的方法: 总结:第二个方法很准
asp.net HttpWebRequest自动识别网页编码

复制代码代码如下: static string GetEncoding(string url) { HttpWebRequest request = null; HttpWebResponse response = null; StreamReader reader = null; try { request = (HttpWebRequest)WebRequest.Create(url); request.Timeout = 20000; request.AllowAutoRedirect
js 显示base64编码的二进制流网页图片

Data URI scheme. Data URI scheme是在RFC2397中定义的,目的是将一些小的数据,直接嵌入到网页中,从而不用再从外部文件载入.比如上面那串字符,其实是一张小图片,将这些字符复制黏贴到火狐的地址栏中并转到,就能看到它了,一张2*2的白色gif图片. 在上面的Data URI中,data表示取得数据的协定名称,image/gif是数据类型名称,base64 是数据的编码方法,逗号后面就是这个image/gif文件base64编码后的数据. 目前,Data URI sc
网页语言编码及asp乱码问题解决方案

最近公司有一个日文项目,由于之前使用的是自己开发的中文CMS,并没有将语言包分离,在网站建设调试过程中出现了令人头疼的乱码问题. 乱码出现的原因由于各个字符编码的储存空间不一样,所以当使用不同的字符读取数据时,当字符空间过小,就不能正常显示了. 比如说中文字符的字符集一般是gb2312,如果用utf-8强制读取改变gb2312的字符,就有可能出现乱码.因为utf-8的字符集储存空间大于gb2312,当使用utf-8读取时,有些字符gb2312的编码中是不存在的,不存在的字符自然会出现乱码了.对
asp.net 网页编码自动识别代码

复制代码代码如下: using System; using System.Net; using System.Text; using System.Text.RegularExpressions; class Program { // 获取网页的HTML内容,根据网页的charset自动判断Encoding static string GetHtml(string url) { return GetHtml(url, null); } // 获取网页的HTML内容,指定Encoding sta
多种语言(big5\gbk\gb2312\utf8\Shift_JIS\iso8859-1)的网页编码切换解决方案归纳

1.response.setContentType("text/html; charset=GB2312"); 或者response.setContentType("text/html; charset=UTF-8"); charset前面留一个空格 2.头文件包含 3. 一般处理是将在网页上提交的中文转码为Unicode存储在数据库中,取出来的时候,用自动转码(ContentType="text/html;charset=gb2312"或Co
ASP UTF-8编码生成静态网页的函数

以下函数采用FSO对象,文件位置在FSO.ASP.FSO对象的文件编码属性只有三种,系统默认,Unicode,ASCII,并没有我们要的utf-8,所以一般中文系统上使用FSO对象生成的文件都是gb2312网页编码格式,无法生成UTF-8编码,因此,英文等拉丁语系和中文可以正常显示,但象俄语等非拉丁语系,页面就会出现乱码. 复制代码代码如下: function createfile(sfilename,scontent) set fso=server.CreateObject("scripti
Base64编码加密JS代码网页版

你可将本页保存后上传到你的网站中,这样你就拥有了一个Base64编码加密.解密的功能页面,让需要的用户去访问你的网页. Base64编码加密 BODY { MARGIN-TOP: 0px; FONT-SIZE: 9pt; MARGIN-LEFT: 0px; MARGIN-RIGHT: 0px; FONT-FAMILY: "宋体" } A { FONT-WEIGHT: 400; FONT-SIZE: 9pt; COLOR: black; TEXT-DECORATION: none } A

ASP+FSO生成的网页文件默认编码格式以及转换成UTF-8编码方法

相关推荐

随机推荐