详谈c++跨平台编码的问题

最近要将一个windows下的项目放到树莓派上,以便充分利用带宽资源,使其以夜继日的工作

在此记录一下编码问题和方案

在windows下,现在用的vs2015,创建的代码文件默认编码是ANSI,windows特有的概念,本地编码,结合实际情况就是gb232

vs在调试的时候,方便查看的有ANSI编码和unicode编码

在代码中

以"你好,world"表示ANSI编码字符串

L"hello,世界"表示unicode编码字符串

以上两种表达方式,不受代码文件本身的编码方式影响

对于linux编程,代码文件默认编码是utf8

在代码中

以"你好,world"表示的字符串,编码以此文件的编码为准

对于L"hello,世界",本人未测试

对于代码中没有非ancii编码字符的源码文件,ANSI和utf8都没什么问题

但如果出现中文,就出现了各种问题,针对上面的那些特性,采取了以下解决方案

源代码文件统一utf8编码,对于vs有一个插件可用 ForceUTF8

代码中的常量字符串统一为L"hello,世界"的unicode编码方式

对于各种接口参数和返回值,尽量给成unicode

对于打印输出,尽量给成utf8编码

同时,为了方便操作,给出utf8和unicode操作宏,方便utf8和unicode的字符串编码转换

以上这篇详谈c++跨平台编码的问题就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持我们。

(0)

相关推荐

  • 详谈c++跨平台编码的问题

    最近要将一个windows下的项目放到树莓派上,以便充分利用带宽资源,使其以夜继日的工作 在此记录一下编码问题和方案 在windows下,现在用的vs2015,创建的代码文件默认编码是ANSI,windows特有的概念,本地编码,结合实际情况就是gb232 vs在调试的时候,方便查看的有ANSI编码和unicode编码 在代码中 以"你好,world"表示ANSI编码字符串 L"hello,世界"表示unicode编码字符串 以上两种表达方式,不受代码文件本身的编码

  • JavaScript 基础问答二

    4. JavaScript的局限性(JavaScript Lminitations) Q:JavaScript程序不能做什么? A:JavaScript代码不能做下列事情: 不能使用用户系统上或者客户端局域网中的打印机或者其他设备. (解决方法,见打印JavaScript输出.) 不能直接访问用户系统或者客户端局域网中的文件:唯一例外就是可以访问浏览器的Cookie文件. (解决方法,见文件访问部分.) 不能直接访问Web服务器上的文件. (解决方法,见文件访问部分.) 实现多重处理或多线程.

  • 详谈java编码互转(application/x-www-form-urlencoded)

    本质上来说,java.net.UrlEncoder适用于将 String 转换为 application/x-www-form-urlencoded MIME 格式的静态方法 时 ,使用 但!一般情况下,web应用中,当你的服务器,页面编码,请求时编码都已经修改为 utf-8后,依然乱码时,此时则应试着用下方所写到的方法 使用URLDecoder将所乱码的数据进行解码, 而在此处简单说一下乱码的场景和简单转换时的执行原理: 首先,form表单提示数据时,默认Content-type:为 appl

  • 详谈js对url进行编码和解码(三种方式的区别)

    Javascript语言用于编码的函数,一共有三个,最古老的一个就是escape().虽然这个函数现在已经不提倡使用了,但是由于历史原因,很多地方还在使用它,所以有必要先从它讲起. escape 和 unescape 实际上,escape()不能直接用于URL编码,它的真正作用是返回一个字符的Unicode编码值.比如"春节"的返回结果是%u6625%u8282,也就是说在Unicode字符集中,"春"是第6625个(十六进制)字符,"节"是第8

  • 详谈python3 numpy-loadtxt的编码问题

    如下所示: data_array = np.loadtxt(filename, #文件名 delimiter=',', #分隔符 skiprows=1, #跳过第一行 dtype=bytes, #数据类型 usecols=use_col_index_lst).astype(str) #用指定列 ''' I think np.loadtxt("tile", dtype=bytes, delimiter="\n").astype(str) might work, but

  • 基于C#开发中的那些编码问题(详谈)

    最近一直在搞各种编码问题,略有心得,与大家分享一番. System.Text提供了Encoding的抽象类,这个类提供字符串编码的方法.常用的编码方式主要有ASCII,Unicode,UTF8(Unicode编码的一种). Unicode有四种编码格式,UTF-8, UTF-16,UTF-32,UTF-7. 字符编码类,ASCIIEncoding ,UTF7Encoding,UnicodeEncoding,UTF32Encoding. 下面对ASCII和Unicode编码进行对比,废话不说,先上

  • JavaScript字符集编码与解码详谈

    一.字符集 1)字符与字节(Character) 字符是各种文字和符号的总称,包括乱码:一个字符对应1~n个字节,一字节对应8位,每位用0或1表示. 2)字符集(Character Set) 字符集是多个字符的集合,每个字符集包含的字符个数不同,常见字符集名称:ASCII字符集.GB2312字符集.Unicode字符集等. 3)字符集编码(Character Encoding) 字符集编码就是将符号转换为计算机可读的二进制,解码就是把二进制转换为人类可读的符号. 字符集大多对应一种编码方式(例如

  • 详谈PHP编码转换问题

    最近恰好要用到unicode编码的转换,就去查了一下php的库函数,居然没找到一个函数可以对字符串进行Unicode的编码和解码!也罢,找不到的话就自己实现一下了... Unicode和Utf-8编码的区别 Unicode是一个字符集,而UTF-8是Unicode的其中一种,Unicode是定长的都为双字节,而UTF-8是可变的,对于汉字来说Unicode占有的字节比UTF-8占用的字节少1个字节.Unicode为双字节,而UTF-8中汉字占三个字节. UTF-8编码字符理论上可以最多到6个字节

  • 详谈Java中的二进制及基本的位运算

    二进制是计算技术中广泛采用的一种数制.二进制数据是用0和1两个数码来表示的数.它的基数为2,进位规则是"逢二进一",借位规则是"借一当二",由18世纪德国数理哲学大师莱布尼兹发现.当前的计算机系统使用的基本上是二进制系统,数据在计算机中主要是以补码的形式存储的.计算机中的二进制则是一个非常微小的开关,用"开"来表示1,"关"来表示0. 那么Java中的二进制又是怎么样的呢?让我们一起来揭开它神秘的面纱吧. 一.Java内置的进

  • 详谈Python高阶函数与函数装饰器(推荐)

    一.上节回顾 Python2与Python3字符编码问题,不管你是初学者还是已经对Python的项目了如指掌了,都会犯一些编码上面的错误.我在这里简单归纳Python3和Python2各自的区别. 首先是Python3-->代码文件都是用utf-8来解释的.将代码和文件读到内存中就变成了Unicode,这也就是为什么Python只有encode没有decode了,因为内存中都将字符编码变成了Unicode,而Unicode是万国码,可以"翻译"所以格式编码的格式.Python3中

随机推荐