UTF8转成GB2312乱码问题解决方案

最近做了一个小项目,遇到此类问题,记录一下,也算是一个总结。
此项目分为两部分,一个是新闻数据采集,一个是采集信息的审核,最后生成XML文件。

数据采集后的数据经过用户编辑完之后,要导出一个ACCESS文件,然后把这个文件导入到信息审核系统。在ACCESS库中存储新闻信息的字段类型是ntext类型,而审核系统库中对应的是varchar(max)类型的字段,导入之后,发现有的空白字符会出现乱码,表现为问号(?),其实经过后面的测试,这不是空白(空格)字符,而一个特殊字符,怎么办?经过几番测试后发现,varchar(max)类型要改成nvarchar(max)类型,这样导入的数据就不会再有此类问题了。

但后面的测试过程中,又会发现对导入后的采集信息更改(通过.net程序编辑功能)后,数据库中此条信息又出现了乱码问题,研究后发现在插入语句中这样写就不会出现此类问题了,如insert into 表名 (news)values(N'"+更新后的值+""),为什么加N?去百度一下就明白了。

到此,心中总算得到安慰,但后面的问题又让人陷入郁闷之中。。。。。。
审核完的信息要生成XML类型的文件,并且XML要采用GB2312编码,因为采集的新闻网站,有很多网站采用的是UTF8编码,这样在转化的过程中又出现乱码(还是那个“空白”特殊字符搞的),怎么办?网上介绍的把UTF8转化成GB2312就可以了,但实际发现,还是解决不了问题,这下弄的一上午为了解决这个问题,最后还是没有办法,正郁闷之时,突然想到通过VS的调试功能来看看这个特殊字符究竟是什么玩意,最后通过把数据库的此字段值读取出来之后,然后转化成字符数组,content.ToCharArray(); 一个一个的看,发现,导致乱码的这个字符是' '注意引号中的空白,这不是一个空格,而是一个在GB2312中无法识别的特殊字符,此时突然想到,能不能把这个字符的值直接用空格替换呢?马上行动,果然,解决了乱码问题。真求郁闷,这一个毛玩意浪费了一半天时间。

注意,必须要用调试出来的这个值(因为这才是真正的导致乱码的那个特殊字符),调试的时候在即使窗体中粘贴。


代码如下:

content = content.Replace(" ", " ");

(0)

相关推荐

  • Utf-8和Gb2312乱码问题的终结

    研究好多天了,也试过好多办法了,总结出目前发现最好的方法: 先说一下基本的东西: <%@ codepage=65001%>UTF-8 <%@ codepage=936%>简体中文 <%@ codepage=950%>繁体中文 <%@ codepage=437 %>美国/加拿大英语 <%@ codepage=932 %>日文 <%@ codepage=949 %>韩文 <%@ codepage=866 %>俄文 codepa

  • 静态gb2312编码在项目传值出现中文乱码现象

    可能标题描述的不是特别清楚 当时的问题是这样的:在我的系统项目中,参考的美工静态页面是gb2312格式的,当此编码拿到项目中后,utf-8编码的系统,加载页面时,会出现样式问题,比如不能正常居中等.(IE6通常有样式问题) 解决办法如下,(如果必须采用gb2312编码的话) 在webconfig的<system.web>中增加 复制代码 代码如下: <globalization requestEncoding="gb2312" responseEncoding=&qu

  • 解决Jquery load()加载GB2312页面时出现乱码的两种方案

    问题描述:jquery的字符集是utf-8,load方法加载完GB2312编码静态页面后,出现中文乱码. a.php 复制代码 代码如下: <script language="javascript" type="text/javascript"> $(function(){ $("#zz").click(function(){ $("#job").load("b.php"); }) }) <

  • UTF8转成GB2312乱码问题解决方案

    最近做了一个小项目,遇到此类问题,记录一下,也算是一个总结. 此项目分为两部分,一个是新闻数据采集,一个是采集信息的审核,最后生成XML文件. 数据采集后的数据经过用户编辑完之后,要导出一个ACCESS文件,然后把这个文件导入到信息审核系统.在ACCESS库中存储新闻信息的字段类型是ntext类型,而审核系统库中对应的是varchar(max)类型的字段,导入之后,发现有的空白字符会出现乱码,表现为问号(?),其实经过后面的测试,这不是空白(空格)字符,而一个特殊字符,怎么办?经过几番测试后发现

  • 将字符串转换成gb2312或者utf-8编码的参数(js版)

    在很多时候,我们直接在url中传递中文参数时,读到的中文都是乱码,那么我们应该怎么将这些参数转换呢? 下面我们来介绍一下方法 1.我们新建一个 UrlEncode.js 然后将下面的代码拷贝进去 复制代码 代码如下: //JS版的Server.UrlEncode编码函数 String.prototype.UrlEncodeGB2312 = function () { var str = this; str = str.replace(/./g, function (sHex) { window.

  • 用Javascript实现UTF8编码转换成gb2312编码

    复制代码 代码如下: //把编码转换成 gb2312编码  function UrlEncode(str)  {  var i, c, ret="", strSpecial="!\"#$%&'()*+,/:;<=>?@[\]^`{|}~%";  for(i = 0; i < str.length; i++)  {  //alert(str.charCodeAt(i)); c = str.charAt(i);  if(c==&quo

  • JAVA读取HDFS的文件数据出现乱码的解决方案

    使用JAVA api读取HDFS文件乱码踩坑 想写一个读取HFDS上的部分文件数据做预览的接口,根据网上的博客实现后,发现有时读取信息会出现乱码,例如读取一个csv时,字符串之间被逗号分割 英文字符串aaa,能正常显示 中文字符串"你好",能正常显示 中英混合字符串如"aaa你好",出现乱码 查阅了众多博客,解决方案大概都是:使用xxx字符集解码.抱着不信的想法,我依次尝试,果然没用. 解决思路 因为HDFS支持6种字符集编码,每个本地文件编码方式又是极可能不一样的

  • SpringMVC Restful风格与中文乱码问题解决方案介绍

    目录 基本要点 1.定义 2.传统方式与Restful风格的区别 3.如何使用Restful风格 4.为什么要用restful 5.乱码问题 基本要点 1.定义 根据百度百科的定义,RESTFUL是一种网络应用程序的设计风格和开发方式 2.传统方式与Restful风格的区别 在我们学习restful风格之前,我们请求接口,都是使用http://localhost:8080/controller?method=add这种方式携带接口所需要的参数 而调用restful风格的接口时,我们可以改成htt

  • Extjs Ajax 乱码问题解决方案

    在一次页面浏览过程中,客户端对一个URL发起浏览请求,服务端针对这次请求进行解析,而在字符编码解析方面,首先他检查该页面中的字符编码设置,即<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />,这样,在页面中显示声明了字符编码为UTF-8,服务器就会将该页面用UTF-8的编码输出,而如果页面中没有显示声明,在服务器中都有一个默认的字符编码,比如GB2312,针对没有声明

  • python开发环境PyScripter中文乱码问题解决方案

    PyScripter看起来还是挺不错的一个python ide 环境: PyScripter 2.6.0.0 python3.4 问题: PyScripter有个小坑,打开文件后中文都成了乱码.在PyScripter中新建的文件中文可以正常显示,但是重新打开后中文乱码. PyScripter中文乱码原因: 原因是如果文件头部没有编码声明,那么PyScripter会默认使用ANSI打开文件. 而PyScripter默认的文件模板也不带编码声明,重新打开文件时间不以UTF-8打开,所以乱码. 解决的

  • SpringMVC请求/响应乱码问题解决方案解析

    这篇文章主要介绍了SpringMVC请求/响应乱码问题解决方案解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 GET请求乱码原因分析 GET请求参数是通过请求行中的URL发送给Web服务器(Tomcat)的. Tomcat服务器会对URL进行编码操作(此时使用的是Tomcat设置的字符集,默认是iso8859-1) 到了我们的应用程序中的请求参数,已经是被Tomcat使用ISO8859-1字符集进行编码之后的了. 解决方式 方式一 修改to

  • pyftplib中文乱码问题解决方案

    这篇文章主要介绍了pyftplib中文乱码问题解决方案,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 采用pyftpdlib启动ftp服务端,ftp客户端在上传文件的时候,如果不指定字符编码,如果遇到中文,可能会乱码:网上找了很多资料,但是他们的客户端都是基于python实现的.还是没法解决我得问题 于是重新:FTPHandler的decode方法 def decode(self, bytes): return bytes.decode('ut

  • JSP服务器端和前端出现乱码问题解决方案

    这篇文章主要介绍了JSP服务器端和前端出现乱码问题解决方案,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 在前端和服务器端交互的过程中主要是通过HTTP协议进行交互的,而在Servlet接口中有提供一个HttpServlet类用于创建应用于HTTP协议的Servlet. 在Servlet容器中提供了ServletRequest和ServletResponse两个类,通过这两个类的对象来获得数据和发送数据.到这里我们就知道如果需要设置编码格式,那

随机推荐