举例讲解C语言链接器的符号解析机制

1. 符号分类
(1)全局符号:非静态全局变量,非静态函数
(2)外部符号:定义于其它模块,而被本模块引用的全局变量和函数
(3)本地符号:静态变量(包括全局和局部),静态函数
对于静态局部变量,编译器会为其生成唯一的名字。如x.fun1,x.fun2。本地符号对链接器来说是不可见的。
2. 符号决议
当编译器遇到一个不是本模块定义的符号时,会假设该函数由其它模块定义,并生成一个链接器符号表条目,交由链接器处理。如果链接器在它的任何输入模块都没有找到该符号,会给出一个类似undefined reference to 'xxx'的链接错误。而如果链接器在输入模块中找到了一个以上的外部符号定义,这个时候就需要链接器进行符号决议,链接器对多个外部符号定义可能并不报错甚至警告,而是按照它的规则去选择其中一个符号定义。
链接器将各个模块输出的全局符号,分类为强符号和弱符号:
(1)强符号:函数和已初始化的全局变量
(2)弱符号:为初始化全局变量
根据强弱符号的定义,链接器按照下面的规则处理多重定义的符号:
规则1:不允许有多个强符号定义
规则2:如果有一个强符号和多个弱符号,那么选择强符号
规则3:如果有多个弱符号,那么从这些弱符号中选择sizeof大的那个,如果大小相同,则选择先链接的那个
上面的规则是很多链接错误的根源,因为编译器在决议时可能默默地替你作出了决定,你并不知晓。根据上面的规则,可以引出下面几个经典例子:
例1:

// in lib1.c
int x;
void f()
{
  x = 1235;
}

// in main1.c
#include<stdio.h>
void f(void);

int x = 1234;

int main(void)
{
  f();
  printf("x=%d\n", x);
  return 0;
}

上面的代码中,main函数printf输出: x=1235。因为链接器通过规则2决议符号x的定义为main.c中的强符号定义,而lib.c的作者并不知情,他对x的使用和修改影响到了main.c。这种交互修改,相互影响将会很复杂,因为大家都以为自己在做对的事情,在用对的变量。而整个决议过程,链接器悄无声息地完成了。
例2:

// in lib2.c
double x;
void f()
{
  x = -0.0;
}

// in main2.c
#include<stdio.h>
void f(void);

int x = 1234;
int y = 1235;

int main()
{
  f();
  printf("x=0x%x y=0x%x \n", x, y);
  return 0;
}

这种情况下,程序得到输出: x=0x0 y=0x80000000,而链接器(gcc ld)也终于给出一条警告:

代码如下:

ld: warning: tentative definition of '_x' with size 8 from 'obj/Debug/lib2.o' is being replaced by real definition of smaller size 4 from 'obj/Debug/main2.o'

链接器决议的是符号地址,而相邻的全局变量可能在.data段中的内存地址也相邻,因此也就引发了更复杂的问题。这一点和栈溢出很像,但是比栈溢出更复杂,因为问题出在多个模块之间,而不是在一个函数内部。
例3:

// in lib3.c
struct
{
  int a;
  int b;
} x;

void f()
{
  x.a = 123;
  x.b = 456;
  printf("in f(): sizeof(x)=%d, (&x)=0x%08x\n", sizeof(x), &x);
}

// in main3.c
#include<stdio.h>
void f(void);

int x;
int y;

int main()
{
  f();
  printf("in main(): sizeof(x)=%d, (&x)=0x%08x, (&x)=0x%08x, x=%d,y=%d \n", sizeof(x), &x, &y, x, y);
  return 0;
}

程序输出:

in f(): sizeof(x)=8, (&x)=0x02489018
in main(): sizeof(x)=4, (&x)=0x02489018, (&y)=0x02489020, x=123,y=0

始终记住,外部符号决议的是地址,因此无论lib3.c和main3.c中,符号x地址都是唯一的,无论其被定义了几次。其次sizeof是编译器决议,与链接无关,编译器只看得到本模块的定义或声明。最后,由于符号x决议到lib3.c中的x,其size是8,因此main3.c中的y的地址比x大8,这是由链接器将lib3.o和main3.o合并后填入可执行文件的.data段的。因此y是无关变量,被初始化为0,注意和例2的区别。
3. 总结
由于符号决议容易引发的种种问题,我们在写C的时候应注意:
尽量用static属性隐藏变量和函数在模块内的声明,就像在C++中尽量用private保护类私有成员一样。
少定义弱符号,尽量初始化全局变量,这样链接器会根据规则1给出多个符号定义的错误。
为链接器设置必要选项,如gcc的 -fno-common,这样在遇到多重符号定义时,链接器会给出警告。
4. C++的符号决议
C++并不支持强弱符号同时存在,所有符号都只能有一个定义(函数重载通过改写函数符号来确保其唯一),因此在很大程度上避免了C中的链接器困扰。

(0)

相关推荐

  • 详解C语言中的符号常量、变量与算术表达式

    C语言中的符号常量 在结束讨论温度转换程序前,我们再来看一下符号常量.在程序中使用 300.20 等类似的"幻数"并不是一个好习惯,它们几乎无法向以后阅读该程序的人提供什么信息,而且使程序的修改变得更加困难.处理这种幻数的一种方法是赋予它们有意义的名字.#define 指令可以把符号名(或称为符号常量)定义为一个特定的字符串: #define 名字 替换文本 在该定义之后,程序中出现的所有在 #define 中定义的名字(既没有用引号引起来,也不是其它名字的一部分)都将用相应的替换文本

  • C语言中无符号数和有符号数之间的运算

    C语言中有符号数和无符号数进行运算(包括逻辑运算和算术运算)默认会将有符号数看成无符号数进行运算,其中算术运算默认返回无符号数,逻辑运算当然是返回0或1了. unsigned int和int进行运算 直接看例子来说明问题吧 #include <iostream> using namespace std; int main() { int a = -1; unsigned int b = 16; if(a > b) cout<<"负数竟然大于正数了!\n";

  • 浅谈C语言中的强符号、弱符号、强引用和弱引用

    首先我表示很悲剧,在看<程序员的自我修养--链接.装载与库>之前我竟不知道C有强符号.弱符号.强引用和弱引用.在看到3.5.5节弱符号和强符号时,我感觉有些困惑,所以写下此篇,希望能和同样感觉的朋友交流也希望高人指点. 首先我们看一下书中关于它们的定义. 引入场景:(1)文件A中定义并初始化变量i(int i = 1), 文件B中定义并初始化变量i(int i = 2).编译链接A.B时会报错b.o:(.data+0x0): multiple definition of `i':a.o:(.d

  • C语言中的强符号和弱符号介绍

    之前在extern "C" 用法详解中已经提到过符号的概念,它是编译器对变量和函数的一种标记,编译器对C和C++代码在生产符号时规则也是不一样的,符号除了本身名字的区别外,还有强符号和弱符号之分 我们先看一段简单的代码 复制代码 代码如下: /* test.c */  void hello();  int main()  {      hello();      return 0;  } 很显然,这段代码是没法链接通过的,它会报错undefined reference to hello

  • 新手小心:c语言中强符号与弱符号的使用

    声明:下面的实例全部在linux下尝试,window下未尝试.有兴趣者可以试一下.文章针c初学者.c语言的强符号和弱符号是c初学者经常容易犯错的地方.而且很多时候,特别是多人配合开发的程序,它引起的问题往往非常行为怪异而且难以定位.什么是强符号和弱符号?在c语言中,函数和初始化的全局变量是强符号,未初始化的全局变量时弱符号.强符号和弱符号的定义是连接器用来处理多重定义符号的,它的规则是:不允许多个强符号:如果一个强符号和一个弱符号,这选择强符号:如果多个弱符号,则任意选一个.它的陷阱:上代码:

  • 深入解读C语言中的符号常量EOF

    EOF是指文件的结束符,是一个宏定义     借助于getchar 与putchar 函数,可以在不了解其它输入/输出知识的情况下编写出 数量惊人的有用的代码.最简单的例子就是把输入一次一个字符地复制到输出,其基本思想 如下: 读一个字符 while (该字符不是文件结束指示符) 输出刚读入的字符 读下一个字符 将上述基本思想转换为C语言程序为: #include <stdio.h> /* copy input to output; 1st version */ main() { int c;

  • 举例讲解C语言链接器的符号解析机制

    1. 符号分类 (1)全局符号:非静态全局变量,非静态函数 (2)外部符号:定义于其它模块,而被本模块引用的全局变量和函数 (3)本地符号:静态变量(包括全局和局部),静态函数 对于静态局部变量,编译器会为其生成唯一的名字.如x.fun1,x.fun2.本地符号对链接器来说是不可见的. 2. 符号决议 当编译器遇到一个不是本模块定义的符号时,会假设该函数由其它模块定义,并生成一个链接器符号表条目,交由链接器处理.如果链接器在它的任何输入模块都没有找到该符号,会给出一个类似undefined re

  • 举例讲解Python中装饰器的用法

    由于函数也是一个对象,而且函数对象可以被赋值给变量,所以,通过变量也能调用该函数. >>> def now(): ... print '2013-12-25' ... >>> f = now >>> f() 2013-12-25 函数对象有一个__name__属性,可以拿到函数的名字: >>> now.__name__ 'now' >>> f.__name__ 'now' 现在,假设我们要增强now()函数的功能,比

  • 举例讲解Go语言中函数的闭包使用

    和变量的声明不同,Go语言不能在函数里声明另外一个函数.所以在Go的源文件里,函数声明都是出现在最外层的. "声明"就是把一种类型的变量和一个名字联系起来. Go里有函数类型的变量,这样,虽然不能在一个函数里直接声明另一个函数,但是可以在一个函数中声明一个函数类型的变量,此时的函数称为闭包(closure). 例: 复制代码 代码如下: packagemain   import"fmt"   funcmain(){     add:=func(baseint)fun

  • 举例讲解C语言程序中对二叉树数据结构的各种遍历方式

    二叉树遍历的基本思想 二叉树的遍历本质上其实就是入栈出栈的问题,递归算法简单且容易理解,但是效率始终是个问题.非递归算法可以清楚的知道每步实现的细节,但是乍一看不想递归算法那么好理解,各有各的好处吧.接下来根据下图讲讲树的遍历. 1.先序遍历:先序遍历是先输出根节点,再输出左子树,最后输出右子树.上图的先序遍历结果就是:ABCDEF 2.中序遍历:中序遍历是先输出左子树,再输出根节点,最后输出右子树.上图的中序遍历结果就是:CBDAEF 3.后序遍历:后序遍历是先输出左子树,再输出右子树,最后输

  • 举例讲解C语言的fork()函数创建子进程的用法

    先来看这样一个例子,利用fork调用execlp()函数来在Linux下实现ps或ls命令: #include "sys/types.h" #include "unistd.h" #include "stdio.h" #include "stdlib.h" int main() { pid_t result; result=fork(); //报错处理 if(result==-1) { printf("Fork Er

  • 举例讲解C语言对归并排序算法的基础使用

    基础概念 百度百科是这么描述归并排序的: 归并操作(merge),也叫归并算法,指的是将两个已经排序的序列合并成一个序列的操作. 设有数列 {6,202,100,301,38,8,1} 初始状态: [6] [202] [100] [301] [38] [8] [1] 比较次数 i=1 [6 202 ] [ 100 301] [ 8 38] [ 1 ] 3 i=2 [ 6 100 202 301 ] [ 1 8 38 ] 4 i=3 [ 1 6 8 38 100 202 301 ] 4 总计: 1

  • 举例讲解Java的RTTI运行时类型识别机制

    1.RTTI: 运行时类型信息可以让你在程序运行时发现和使用类型信息. 在Java中运行时识别对象和类的信息有两种方式:传统的RTTI,以及反射.下面就来说下RTTI. RTTI:在运行时,识别一个对象的类型.但是这个类型在编译时必须已知. 下面通过一个例子来看下RTTI的使用.这里涉及到了多态的概念:让代码只操作基类的引用,而实际上调用具体的子类的方法,通常会创建一个具体的对象(Circle,Square,或者Triangle,见下例),把它向上转型为Shape(忽略了对象的具体类型),并在后

  • C语言 超详细讲解链接器

    目录 1 什么是链接器 2 声明与定义 3 命名冲突 3.1 命名冲突 3.2 static修饰符 4 形参.实参.返回值 5 检查外部类型 6 头文件 1 什么是链接器 典型的链接器把由编译器或汇编器生成的若干个目标模块,整合成一个被称为载入模块或可执行文件的实体–该实体能够被操作系统直接执行. 链接器通常把目标模块看成是由一组外部对象组成的.每个外部对象代表着机器内存中的某个部分,并通过一个外部名称来识别.因此,==程序中的每个函数和每个外部变量,如果没有被声明为static,就都是一个外部

  • 举例讲解Python装饰器

    在Python里面,函数可以作为参数传入一个函数,函数也可以复制给变量,通过变量调用函数.装饰器可以扩展一个函数的功能,为函数做一个装饰器注解,可以把装饰器里面定义的功能于所有函数提前执行,提升代码的复用程度. 现在有这么个场景. 打卡 互联网公司里面有各种员工,程序员,前台...,程序员在打开电脑前,需要打卡,前台要早点来开门(我也不清楚,谁开门,这里假定,前台开门),前台开门前也需要打卡.也就是说,打卡是所有员工的最先的公共动作,那么可以把打卡这个功能抽出来作为公共逻辑. 普通函数调用方法

  • 易语言无法定位链接器解决方法

    易语言开发环境的诞生,影响了众多编程爱好者的关注的追捧.的确,很多编程爱好者在使用易语言的同时产生了很多的困惑,这些困惑很多,比如易语言无法定位链接器. 1.首先,打开易语言,创建一个"Windows窗口程序"空白工程,操作如下: 2.进入窗口界面以后,我们不编写任何的代码,就只有一个空白的窗口.如图: 3.然后,点击工具条中的"运行"按钮或者按下"F5"键运行程序,如图: 4.从运行结果可以看出,程序是没有问题的.那么,我们来静态编译一下,看看

随机推荐