JScript中使用ADODB.Stream判断文件编码的代码
一开始使用ASCII编码来读取文本数据,模拟读取二进制数据,但是发现如果字符编码大于127时,只会得到小于128的值,相当于和128取余了,因此ASCII编码是不行的。
继续寻找,在CodeProejct.com找到一篇文章《Reading And Writing Binary Files Using JScript》,里面刚好有我需要的内容。
其实说来也简单,就是把编码换一下,使用437,这个是IBM扩展过的ASCII编码,把ASCII编码的最高位也利用起来,将字符集中的字符从128个扩展到256个,而使用这个字符集读取的字符数据就相当于原始二进制数据了。
解决了障碍后,就要开始识别文件的编码了,通过使用ADODB.Stream对象来读取文件的开始两个字节,然后根据这两个字节就可以判断文件编码是什么了。
UTF-8文件如果带BOM的话,那么头两个字节就是0xEF、0xBB,再例如Unicode文件的开始两个字节是0xFF、0xFE,这些就是判断文件编码的依据。
需要注意的是,在ADODB.Stream读取字符时,并不是一一对应的,也就是说,如果二进制数据是0xEF,读取出来的字符经过charCodeAt之后,并不是0xFE,而是另外的值,这个对应表可以在上面提到的文章里查到。
function CheckEncoding(filename) {
var stream = new ActiveXObject("ADODB.Stream");
stream.Mode = 3;
stream.Type = 2;
stream.Open();
stream.Charset = "437";
stream.LoadFromFile(filename);
var bom = escape(stream.ReadText(2));
switch(bom) {
// 0xEF,0xBB => UTF-8
case "%u2229%u2557":
encoding = "UTF-8";
break;
// 0xFF,0xFE => Unicode
case "%A0%u25A0":
// 0xFE,0xFF => Unicode big endian
case "%u25A0%A0":
encoding = "Unicode";
break;
// 判断不出来就使用GBK,这样可以在大多数情况下正确处理中文
default:
encoding = "GBK";
break;
}
stream.Close();
delete stream;
stream = null;
return encoding;
}
这样,在需要的时候,通过调用CheckEncoding函数就可以获取文件的编码了。
希望此文对你有所帮助。
相关推荐
-
ADODB.Stream组件Charset属性值集合
翻了半天MSDN后找到的,|后边是别名 复制代码 代码如下: ANSI_X3.4-1968|iso-8859-1 ANSI_X3.4-1986|iso-8859-1 arabic|iso-8859-6 ascii|iso-8859-1 ASMO-708 Big5 chinese|gb2312 CN-GB|gb2312 cp1256|windows-1256 cp367|iso-8859-1 cp819|iso-8859-1 cp852|ibm852 cp866|ibm86
-
asp adodb.stream对象的方法/属性
adodb.stream对象的方法/属性 Cancel 方法 使用方法如下 Object.Cancel 说明:取消执行挂起的异步 Execute 或 Open 方法的调用. Close 方法 使用方法如下 Object.Close :关闭对像 CopyTo 方法 使用方法如下 Object.CopyTo(destStream,[CharNumber]) 说明:将对像的数据复制,destStream指向要复
-
adodb.stream读文件到数组的代码
Function filenum(filename,i) Dim st,s Set st= CreateObject("ADODB.Stream") st.Type = 2 '流类型为文本 st.Mode = 3 '模式为读写 st.Open st.LineSeparator=13 st.LoadFromFile filename Do While Not St.EOS s = Split(st.readtext(), vbCrLf) Loop 'MsgBox UBoun
-
用ADODB.Stream转换
用ADODB.Stream转换,用streamtochar这个函数 <HTML> <html> <head> <META http-equiv="Content-Type" content="text/html; charset=Big5"> <title>test</title> <SCRIPT LANGUAGE="JavaScript"> <!-- wi
-
exe2swf 工具(Adodb.Stream版)
Exe2swf ,将exe 格式的 flash文件转为swf 格式.网上有很多这方面的工具,这个是用vbscript写的.用法: 将下面代码存为 exe2swf.vbs 将exe格式的flash拖放在此文件上,即可生成swf文件, 更新日期:2005-01-20 09:30 复制代码 代码如下: 'exe2swf工具, '用法:将exe格式的flash拖放在此文件上,即可生成swf文件, 'haiwa@http://www.51windows.Net '感谢jimbob提供帮助. dim As
-
asp下用ADODB.Stream代替FSO读取文本文件
'文件内容读取. 复制代码 代码如下: Function LoadFile(ByVal File) Dim objStream On Error Resume Next Set objStream = Server.CreateObject("ADODB.Stream") If Err.Number=-2147221005 Then Response.Write "<div align='center'>非常遗憾,您的主机不支持ADODB.Stream,不能使用本
-
利用MSXML2.XmlHttp和Adodb.Stream采集图片
利用MSXML2.XmlHttp和Adodb.Stream 复制代码 代码如下: <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml"> <
-
使用asp下的adodb.stream 下载文件而不是打开
在浏览器的地址栏里直接输入一个doc或xls或jpg的文件的url路径,那么该文件会直接显示在浏览器里.而在很多时候我们希望能直接弹出下载提示框让用户下载,我们该怎么办呢?这里有两种方法: 1.设置你的服务器的iis,给doc等后缀名做映射. 2.在向客户端发送时设置其contenttype. 下面详细说明方法2 程序代码: 复制代码 代码如下: <% Response.Buffer = true Response.Clear dim url Dim fso,fl,flsize dim
-
windows2008+iis7无组件上传写入文件失败ADODB.Stream 错误 800a0bbc问题
现象:写入文件失败,ADODB.Stream 错误 800a0bbc 条件:在已排除一般的解决方法文件夹权限后,并且服务器为windows2008 希望写这文章可以让大家避免浪费太多时间,最快地解决问题. 一个ASP程序用到无组件上传,在本地XP SP3 IIS5.1及在Windows Server 2003 + IIS6.0上测试均为可以正常上传.到把程序放了windows2008+IIS7.0上发现内部服务器错误500,最后我把其调为可显示详细错误信息,显示为: 写入文件失败,ADODB.S
-
JScript中使用ADODB.Stream判断文件编码的代码
一开始使用ASCII编码来读取文本数据,模拟读取二进制数据,但是发现如果字符编码大于127时,只会得到小于128的值,相当于和128取余了,因此ASCII编码是不行的. 继续寻找,在CodeProejct.com找到一篇文章<Reading And Writing Binary Files Using JScript>,里面刚好有我需要的内容. 其实说来也简单,就是把编码换一下,使用437,这个是IBM扩展过的ASCII编码,把ASCII编码的最高位也利用起来,将字符集中的字符从128个扩展到
-
python中判断文件编码的chardet(实例讲解)
1.实测,这个版本在32位window7和python3.2环境下正常使用. 2.使用方法:把解压后所得的chardet和docs两个文件夹拷贝到python3.2目录下的Lib\site-packages目录下就可以正常使用了. 3.判断文件编码的参考代码如下: file = open(fileName, "rb")#要有"rb",如果没有这个的话,默认使用gbk读文件. buf = file.read() result = chardet.detect(buf)
-
用XMLDOM和ADODB.Stream实现base64编码解码实现代码
复制代码 代码如下: <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN"> <html> <head> <title> 用 XMLDOM 和 ADODB.Stream 实现base64编码解码 </title> <meta http-equiv="Content-Type" content="text/html; cha
-
php获取目录中所有文件名及判断文件与目录的简单方法
一,php获取目录中的所有文件名 1.打开要操作目录的目录句柄 代码示例: //打开当前目录下的目录pic下的子目录common. $handler = opendir('pic/common'); 2.循环读取目录下的所有文件 代码示例: /*其中$filename = readdir($handler) 每次循环时将读取的文件名赋值给$filename,$filename !== false. 一定要用!==,因为如果某个文件名如果叫'0′,或某些被系统认为是代表false,用!=就会停止循
-
Python中根据时间自动创建文件夹的代码实现
导语 电脑桌面文件太多查找起来比较花费时间,并且凌乱的电脑桌面也会影响工作心情,于是利用python根据时间自动建立当日文件夹,这样就可以把桌面上文件按时间进行存放. 代码实现 # _*_coding:utf-8_*_ import os import datetime def create_folder(path): # 年-月-日 时:分:秒 now_time = datetime.datetime.now().strftime("%Y-%m-%d %H:%M:%S") # 年
-
asp之基于adodb.stream的文件操作类
复制代码 代码如下: <% '************************************************************* '转发时请保留此声明信息,这段声明不并会影响你的速度! '************************************************************* '************************************************************* '@author:
-
Shell中使用scp命令实现文件上传代码
自从法现 SSH 可以执行远端命令后,ftp 软件也渐渐很少用了. 每次更新服务器代码,都要打包.上传.登录到服务器修改文件权限.更新 Cache 等等,又慢又容易出错,所以做成脚本,一次帮我搞定,自己就点上一根烟坐在电脑面前发呆,要么就玩会儿<植物大战僵尸>啥的,悠闲! PS: Ant 以及 Phing 用户,你们可以无视了- 我只是喜欢玩 Shell 而已. 复制代码 代码如下: #!/bin/sh HOME='/cygdrive/d/public_html/myproject'
-
PHP中设置时区,记录日志文件的实现代码
复制代码 代码如下: <html><body><?phpdate_default_timezone_set('Asia/Hong_Kong'); //set time zoneset_error_handler("myHandler"); //set error handler$chinatime = date('Y-m-d H:i:s'); //get current time$max_size =
随机推荐
- MSN圣诞照片(Backdoor.Win32.PBot.a)病毒分析解决
- 易语言基础教程之定义及变量
- Spring与Hibernate整合事务管理的理解
- perl脚本学习指南--读书笔记
- JS选中checkbox后获取table内一行TD所有数据的方法
- bootstrap下拉菜单使用方法解析
- Python中让MySQL查询结果返回字典类型的方法
- EJB轻松进阶之一
- 用户输入密码的强度
- vue-resouce设置请求头的三种方法
- 几种显示数据的方法的比较
- 批处理下载FTP服务器上指定分钟数之前的文件
- javascript事件处理模型实例说明
- Javascript中自动切换焦点实现代码
- 在Node.js中使用Javascript Generators详解
- 仿豆瓣分页原型(Javascript版)
- 深入浅出webpack之externals的使用
- 微信小程序之判断页面滚动方向的示例代码
- MySQL数据表合并去重的简单实现方法
- centos7 安装mysql和mysqlclient遇到的坑总结