C#读写指定编码格式的文本文件

在工作中经常读写文本文件,在读文件时,需要按开头的两个字节判断文件格式,然后按该格式读文件中的内容。
 写文件时,也要按目标文件指定的格式来写入,只有这样才能让后续的环境正确读入。

1 查看格式
    在vs2010开发环境打开某个文件,然后从菜单上, 文件--高级保存选项,就可看到当前文件的编码格式。
  比如,xx.cs,xx.cshtml文件看到的是[简体中文(GB2312)-代码页936],就是GB2312。
  xx.xml文件看到的是[Unicode(UTF-8带签名)-代码页65001],就是UTF-8。
  常用的格式有:ASCII,UTF-8,UTF-7,UTF-32,Unicode,GB2312 。

2 读格式文件为

 Encoding encode=Encoding.GetEncoding("GB2312"));
 可以使用后附的类,先读文件的编码格式
 encode = fileEncode.GetFileEncodeType("in_file.txt");
 string strStr1 = File.ReadAllText("in.txt", encode);

3 写格式文件为

 StreamWriter sw = new StreamWriter("out.txt", false, Encoding.GetEncoding("ASCII"));
 sw.Write("12.3");
 sw.Close();

4 根据文件的编码格式读写文件的完整代码

using System;
using System.Collections.Generic;
using System.Linq;
using System.Xml;
using System.IO;
using System.Configuration;
using System.Text;

namespace WebApplication1
{
//=1=按文件编码格式读写
  public partial class _Default : System.Web.UI.Page
  {
    string proj_name = "";
    protected void Page_Load(object sender, EventArgs e)
    {
      string xml_in_file="c:\\part.xml";//输入片段,其它程序生成的是一个节点
      string xml_out_file="c:\\all.xml";//整体,新节点片段,要追加到其尾部
//1 读入输入文件的编码格式,并按其编码全部读入文本
      Encoding encode1 = fileEncode.GetFileEncodeType(xml_in_file);

      StringBuilder strSb1 = new StringBuilder();
      string strStr1 = File.ReadAllText(xml_in_file, encode1);
//
      StringBuilder strSb = new StringBuilder();
      strSb.Clear();

//2 读入输出文件的编码格式,并按其编码全部读入文本
      Encoding encode6 = fileEncode.GetFileEncodeType(xml_out_file);
      strSb.AppendFormat("{0} \r\n", File.ReadAllText(xml_out_file, encode6));
      strSb.Replace(strStr1, "");//旧的同名段落替换为空
//新节点片段,替换整体末尾标签,即是加入到末尾
      strSb.Replace("</object_set>", strStr1 + "\r\n" + "</object_set>");//新的插入到末尾

      // FileInfo myFile = new FileInfo(xml_out_file);
      // StreamWriter sw = myFile.CreateText();
      StreamWriter sw = new StreamWriter(xml_out_file, false, encode6);//Encoding.GetEncoding("GB2312"));
      sw.Write(strSb.ToString());
      sw.Close();
    }
  }

//=2=获得文件编码格式的类
  public class fileEncode
  {//获得文件编码格式的类
    public static System.Text.Encoding GetFileEncodeType(string filename)
    {
      System.IO.FileStream fs = new System.IO.FileStream(filename, System.IO.FileMode.Open, System.IO.FileAccess.Read);
      System.IO.BinaryReader br = new System.IO.BinaryReader(fs);
      Byte[] buffer = br.ReadBytes(2);
      br.Close();
      fs.Close();

      if (buffer[0] >= 0xEF)
      {
        if (buffer[0] == 0xEF && buffer[1] == 0xBB)
        {
          return System.Text.Encoding.UTF8;
        }
        else if (buffer[0] == 0xFE && buffer[1] == 0xFF)
        {
          return System.Text.Encoding.BigEndianUnicode;
        }
        else if (buffer[0] == 0xFF && buffer[1] == 0xFE)
        {
          return System.Text.Encoding.Unicode;

        }
        else
        {
          return System.Text.Encoding.Default;
        }
      }
      else
      {
        return System.Text.Encoding.Default;
      }
    }

  }
}

以上就是C#读写指定编码格式文本文件的方式方法,希望对大家的学习有所帮助。

(0)

相关推荐

  • C#如何自动识别文件的编码

    前言 C#中识别文件的编码是一个头疼的问题,最近在做导入微信商户后台退款数据时,无论怎么设置编码导出来都是乱码,后来在网上找了这个识别文件编码的代码,感觉不错.最后识别出来是gb2312,看来我还是太渣了,只能吃土了,竟然忘记了这个编码. 下面话不多说,上代码. /// <summary> /// 用于取得一个文本文件的编码方式(Encoding). /// </summary> public class TxtFileEncoder { public TxtFileEncoder

  • asp.C#实现图片文件与base64string编码解码

    图片当然是存在那个js文件里面,于是我就打开了flashblocker.js,然后浏览一下,找到下面一句: var flash = '......' (小白)<SPAN style="FONT-SIZE: small">这是我第一次认识到base64的用场,记得以前保存网页的时候,总习惯保存为.mht格式,因为这样会把网页中的图片也保存下来,但是一直奇怪为何

  • JS与C#编码解码

    escape不编码字符有69个:*,+,-,.,/,@,_,0-9,a-z,A-Z encodeURI不编码字符有82个:!,#,$,&,',(,),*,+,,,-,.,/,:,;,=,?,@,_,~,0-9,a-z,A-Z encodeURIComponent不编码字符有71个:!, ',(,),*,-,.,_,~,0-9,a-z,A-Z 1. JS: escape : js使用数据时可以使用escape    例如:搜藏中history纪录.    0-255以外的unicode值进行编码时

  • C#实现获取文本文件的编码的一个类(区分GB2312和UTF8)

    以下是获取文件编码的一个类: using System; using System.IO; using System.Text; /// <summary> /// FileEncoding 的摘要说明 /// </summary> namespace FileEncoding { /// <summary> /// 获取文件的编码格式 /// </summary> public class EncodingType { /// <summary>

  • c# Base64编码和图片的互相转换代码

    事出有因 我们已经做了一个编辑器,这个编辑器可以以xml格式存储一些信息.在存储图片信息时我们碰到了一些问题.我们本来在xml信息中存储的是图片的路径,然而一旦客户把这个信息copy到其他电脑上而没有同时copy相关的图片时,就会出现一些问题.          后来,我们把图片数据转换为Base64编码,替代了原先存储图片路径的方式. 转换流程 将图片转化为Base64字符串的流程是:首先使用BinaryFormatter将图片文件序列化为二进制数据,然后使用Convert类的ToBase64

  • c#检测文本文件编码的方法

    C#如何检测文本文件的编码,本文为大家分享了示例代码,具体内容如下 using System; using System.Text; using System.Text.RegularExpressions; using System.IO; namespace KlerksSoft { public static class TextFileEncodingDetector { /* * Simple class to handle text file encoding woes (in a

  • C#解码base64编码二进制数据的方法

    本文实例讲述了C#解码base64编码二进制数据的方法.分享给大家供大家参考.具体如下: 通过在Convert类的静态方法Convert.FromBase64String,可以讲base64编码的字符串解码为等效的byte []数组. using System; static class MyModClass { public static byte[] Base64DecodeString(this string inputStr) { byte[] decodedByteArray = Co

  • C#中字符串编码处理

    GB2312是简体中文系统的标准编码 用"区" 跟"位"的概念表示 称之为区位码 区指代大的范围 位相当于偏移量.每个汉字占两个字节高位字节"的范围是0xB0-0xF7,"低位字节"的范围是0xA1-0xFE.它的规律好像是按拼音a到z的顺序排列的"啊"字是GB2312之中的第一个汉字,它的区位码就是1601为此我们现在用代码的方式输出一个汉字c#下是little字节序 b0跑后面去了. 复制代码 代码如下: ush

  • c#字符串编码编码(encoding)使用方法示例

    Unicode有四种编码格式,UTF-8, UTF-16,UTF-32,UTF-7. 字符编码类,ASCIIEncoding ,UTF7Encoding,UnicodeEncoding,UTF32Encoding. 复制代码 代码如下: using System.Collections.Generic;using System.Text; namespace AsciiEncodingDemo{    class Program    {        static void Main(stri

  • C# Base64编码函数

    一. Base64的编码规则        Base64编码的思想是是采用64个基本的ASCII码字符对数据进行重新编码.它将需要编码的数据拆分成字节数组.以3个字节为一组.按顺序排列24 位数据,再把这24位数据分成4组,即每组6位.再在每组的的最高位前补两个0凑足一个字节.这样就把一个3字节为一组的数据重新编码成了4个字节.当所要编码的数据的字节数不是3的整倍数,也就是说在分组时最后一组不够3个字节.这时在最后一组填充1到2个0字节.并在最后编码完成后在结尾添加1到2个 "=".

随机推荐