C++中Digraphs、Trigraphs和Tokens的深入讲解

前言

最近偶然在[C++ Quiz](http://cppquiz.org)上看到一道题:

// 以下代码的输出是什么?
#include<iostream>

int main(){
 int x=0; //What is wrong here??/
 x=1;
 std::cout<<x;
}

这个看似简单,实际很容易采坑。

之前也是偶然间了解到C++的 Digraph(双字符组) ,但是当时没有进行扩展了解,没想到C++还有 Trigraph(三字符组) …,这个概念其实也很简单,维基百科的词条 三字符组与双字符组 写的也很清楚,就直接搬运过来一下。

下面话不多说了,来一起看看详细的介绍吧

缘起

C语言的源程序的最低必须的字符集是基于7位ASCII码字符集,是 ISO 646-1983 Invariant Code Set的一个超集。ISO 646最初是1972年颁布的一项国际化的7位ASCII标准,规定了12个字符所对应的 码位 保持对各国标准开放: # $ @ [ \ ] ^ ` { | } ~ 。 因此法国标准AFNOR NF Z 62010-1982把码位0x7c(ASCII码的 | )定义为ù,用法文键盘就难以输入C语言的位或运算符 | ;码位0x7e(ASCII码的 ~)定义为 ¨ (即 分音符 ),法文键盘就难以输入C语言的位非运算符 ~ 。 加拿大法语标准CSA Z243.4-1985中把码位0x5e(ASCII码的 ^ )在定义为É,导致难以输入C语言的异或运算符 ^ 。

三字符组

为解决上述的C语言源代码输入问题,C语言标准规定预处理器(C preprocessor)在扫描处理C语言源文件时,替换下述的3字符出现为1个字符

三字符组 替换为
??= #
??/ \
??' ^
??( [
??) ]
??! |
??< {
??> }
??- ~

注意 : 编译器对 三字符组 的处理是在解析注释、宏的步骤的前面,可以理解为优先处理 三字符组

那我们再回头看上面那个题,其等价于:

// 以下代码的输出是什么?
#include<iostream>

int main(){
 int x=0; //What is wrong here\ <- ??/被解释为\,使得自动折行
 x=1;        <- 此行其实是被注释掉的
 std::cout<<x;
}

故,如果希望在源程序中有两个连续的问号,且不希望被预处理器替换,这种情况出现在字符常量、字符串字面值或者是程序注释中,可选办法是用字符串的自动连接: "...?""?..." 或者转义序列: "...?\?..." 。

注意 : Trigraph(三字符组) 在 C++17 被移除了语法

从Microsoft Visual C++ 2010版开始,该编译器默认不再自动替换三字符组。如果需要使用三字符组替换(如为了兼容古老的软件代码),需要设置编译器命令行选项 /Zc:trigraphs

g++仍默认支持三字符组,但会给出编译警告。

双字符组

1994年公布了一项C语言标准的修正案,引入了更具有可读性的5个双字符组。这也包括进了 C99标准。

双字符组 替换为
<: [
:> ]
<% {
%> }
%: #

不同于 三字符组 在源文件的任何出现都会被预处理器替换, 双字符 如果出现在字符串字面值(quoted string)、字符常量、程序注释中将不被替换 。双字符组的替换发生在编译器对源程序的tokenization阶段(即识别出关键字、标识符等,类似于自然语言的“断词”),仅当双字符组作为一个token或者token的组成部分时(如 %:%: 被替换为预处理运算符 ## ),双字符组才被替换为单字符。 g++支持上述双字符组替换。但Microsoft Visual C++不支持双字符组替换。

Token

C++标准支持C语言的三字符组与双字符组(包括C99中的增补)。C++自身还提供了下述内置的关键字:

关键字 等价于
and &&
bitor |
or ||
xor ^
compl ~
bitand &
and_eq &=
or_eq |=
xor_eq ^=
not !
not_eq !=

Microsoft Visual C++编译器要求如果使用上述关键字,必须包含头文件 ciso646,否则编译报错。如“ error C2065: ‘not' : undeclared identifier”。而g++编译器就不要求包含头文件ciso646。

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,如果有疑问大家可以留言交流,谢谢大家对我们的支持。

(0)

相关推荐

  • C++中Digraphs、Trigraphs和Tokens的深入讲解

    前言 最近偶然在[C++ Quiz](http://cppquiz.org)上看到一道题: // 以下代码的输出是什么? #include<iostream> int main(){ int x=0; //What is wrong here??/ x=1; std::cout<<x; } 这个看似简单,实际很容易采坑. 之前也是偶然间了解到C++的 Digraph(双字符组) ,但是当时没有进行扩展了解,没想到C++还有 Trigraph(三字符组) -,这个概念其实也很简单,维

  • java中volatile不能保证线程安全(实例讲解)

    今天打了打代码研究了一下java的volatile关键字到底能不能保证线程安全,经过实践,volatile是不能保证线程安全的,它只是保证了数据的可见性,不会再缓存,每个线程都是从主存中读到的数据,而不是从缓存中读取的数据,附上代码如下,当synchronized去掉的时候,每个线程的结果是乱的,加上的时候结果才是正确的. /** * * 类简要描述 * * <p> * 类详细描述 * </p> * * @author think * */ public class Volatil

  • Android中FontMetrics的几个属性全面讲解

    今天和大家聊一聊Android中关于FontMetrics的几个属性的理解,在Android中用画笔绘制文字时,文字最终的大小是和绘制文字的字体的类型和字体的大小是相关的. 设置字体类型 Paint.setTypeface(Typeface typeface) 设置字体大小 Paint.setTextSize(float textSize) Paint.FontMetrics有5个属性,并且这5个属性都是跟字体相关的,下面是官方API文档的解释: 翻译一下他的意思: 1. 基准点是baselin

  • python中判断文件编码的chardet(实例讲解)

    1.实测,这个版本在32位window7和python3.2环境下正常使用. 2.使用方法:把解压后所得的chardet和docs两个文件夹拷贝到python3.2目录下的Lib\site-packages目录下就可以正常使用了. 3.判断文件编码的参考代码如下: file = open(fileName, "rb")#要有"rb",如果没有这个的话,默认使用gbk读文件. buf = file.read() result = chardet.detect(buf)

  • 基于TabLayout中的Tab间隔设置方法(实例讲解)

    TabLayout和ViewPager搭配使用,是有很多方便性,但是TabLayout这东西还是有很多被人吐槽的地方. 这里只讲怎么设置tab之间的间隔,网上找了一堆方法,什么padding和margin的啥都没用,没办法,想用TabLayout只能自己想办法了.效果如下: 一.实现方法,既然这东西不好设置,那就直接在背景上做点事情,布局代码如下: <android.support.design.widget.TabLayout xmlns:app="http://schemas.andr

  • python中字符串变二维数组的实例讲解

    有一道算法题题目的意思是在二维数组里找到一个峰值.要求复杂度为n. 解题思路是找田字(四边和中间横竖两行)中最大值,用分治法递归下一个象限的田字. 在用python定义一个二维数组时可以有list和numpy.array两种方式,看了几篇python中二维数组的建立的博客发现大多都是建立的初始化的二维数组,而我需要通过文件读取得到的是字符串,再把字符串转换为二维数组,找不到解决方法还是决定自己来转换. 首先,最开始的字符串输出如下,数字之间有空格 思路就是把先按换行符进行切片,再对每一行的字符再

  • 在Windows中设置Python环境变量的实例讲解

    在 Windows 设置环境变量 在环境变量中添加Python目录: 在命令提示框中(cmd) : 输入 path=%path%;C:\Python 按下"Enter". 注意: C:\Python 是Python的安装目录. 也可以通过以下方式设置: • 右键点击"计算机",然后点击"属性" • 然后点击"高级系统设置" • 选择"系统变量"窗口下面的"Path",双击即可! • 然后

  • Django中反向生成models.py的实例讲解

    命令行中进入Django项目目录,执行 python manage.py inspectdb testmodel_test 其中testmodel_test为数据表,生成的结果 from django.db import models class TestmodelTest(models.Model): name = models.CharField(max_length=20) c1 = models.CharField(max_length=255, blank=True, null=Tru

  • 对Django中的权限和分组管理实例讲解

    权限 Django中内置了权限的功能.他的权限都是针对表或者说是模型级别的.比如对某个模型上的数据是否可以进行增删改查操作.他不能针对数据级别的,比如对某个表中的某条数据能否进行增删改查操作(如果要实现数据级别的,考虑使用django-guardian).创建完一个模型后,针对这个模型默认就有四种权限,分别是增/删/改/查.可以在执行完migrate命令后,查看数据库中的auth_permission表中的所有权限. 字段: content_type_id:是一个外键,参考表是django_co

  • Python 使用PIL中的resize进行缩放的实例讲解

    今天突然发现自己缩放程序有问题,图片缩放尺度大了就会失真.小编一直使用的是缩小的功能,图片缩小整体0.7还可以,整体缩小0.65就会有部分的信息丢失,怎奈我的图都是大图,没办法只能寻找解决方法. 原来代码 img = img.resize((width, height)) 后来找资料发现 PIL带ANTIALIAS滤镜缩放结果 所以将代码改为: img = img.resize((width, height),Image.ANTIALIAS) 以上这篇Python 使用PIL中的resize进行

随机推荐