详解C语言未初始化的局部变量是多少

C语言中,未初始化的局部变量到底是多少?

答案往往是:

  • 与编译器有关。
  • 可能但不保证初始化为0。
  • 未确定。

总之,全部都是些一本正经的形而上答案,这很令人讨厌。

但凡一些人给你滔滔不绝地扯编译器,C库,处理器体系结构却给不出一个实际场景复现问题的时候,这人大概率在扯淡。

又是周五回家时,大巴车上作短文一篇。

其实,这个问题本身就是错误的问法,说全了能讲10万字,我们只要能在特定场景下确定其特定行为就OK了,当然,这就需要设计一个比较OK的实验。

在演示一个实际代码行为之前,先给出一个知识, CPU不认识变量,更无法识别变量的名字,CPU只会从特定的内存位置取值或者将值存到特定的内存位置,因此当问一个变量的值是多少的时候,必须要知道这个变量对应的值被保存在什么地方。

来看下面的代码:

#include <stdio.h>

void func1()
{
 int a;
 printf("func1:%d\n", a);
 a = 12345;
}

void func2()
{
 int b;
 printf("func2:%d\n", b);
}

void func4()
{
 int d;
 printf("func3:%d\n", d);
}

void func3()
{
 int c;
 printf("func3:%d\n", c);
 c = 54321;
 func4();
}

void test_call()
{
 func3();
}

int main(int argc, char **argv)
{
 func1();
 func2();

 test_call();
}

我们有func1~func4一共4个函数,其内部均有一个未初始化的局部变量,它们的值到底是多少呢?

对于这种局部变量,它们的值取决于:

  • 变量在栈中的位置。
  • 变量对应的栈位置在 之前 有没有被store过。

可以看到,上述第一点标记了一个内存位置,第二点则是代码的行为,也就是说,只要有代码去store对应的位置, 且后续的代码没有reset该位置的值的话,该位置就会保留着原先被store后的值。

验证非常简单,试一下就知道了:

[root@localhost test]# ./a.out
func1:0
func2:12345
func3:0
func3:0

按照函数调用栈帧的变化,func1的局部变量a和func2的局部变量b显然是位于同一个位置的,在func1被调用时,这是一块新的内存(可能在进入main之前有栈帧到达过这个位置),a的值取决于调入内存该位置的页面对应偏移的初始值,这取决于操作系统:

操作系统在分配给程序页面时可能会将页面clear为零页。

栈的分配不会涉及C库,这里显然并不涉及C库的行为,但类似malloc分配的内存则涉及C库了。

打印结果,a的值为0,我们认为操作系统返回给了应用程序零页。接下来在func1中将其赋值12345之后函数返回,接下来调用func2的时候,在之前func1已经退出的栈帧位置重建栈帧,对应位置依然还是12345。

我没有看到func1的ret操作后面有stack清0的代码指令。效率考虑,也不该有这样的指令。

再看test_call函数,很明显,func3和func4调用使用的并不是同一个栈帧,因此即便是在func3中对c赋值了54321,也不会影响在其栈帧之上的func4的栈帧对应位置的值d。因此c和d的初始值均保持为0。

那么,初始化一个局部变量和不初始化一个局部变量,在指令层面上,区别在哪里呢?

很简单,亲眼看一下就知道,先看未初始化局部变量的func1:

// int a;
00000000004005ad <func1>:
 4005ad: 55      push %rbp
 4005ae: 48 89 e5    mov %rsp,%rbp
 4005b1: 48 83 ec 10    sub $0x10,%rsp
 4005b5: 8b 45 fc    mov -0x4(%rbp),%eax
 4005b8: 89 c6     mov %eax,%esi
 4005ba: bf 90 07 40 00   mov $0x400790,%edi
 4005bf: b8 00 00 00 00   mov $0x0,%eax
 4005c4: e8 b7 fe ff ff   callq 400480 <printf@plt>
 4005c9: c7 45 fc 39 30 00 00 movl $0x3039,-0x4(%rbp)
 4005d0: c9      leaveq
 4005d1: c3      retq

再看初始化局部变量a为2222的版本:

// int a = 2222;
00000000004005ad <func1>:
 4005ad: 55      push %rbp
 4005ae: 48 89 e5    mov %rsp,%rbp
 4005b1: 48 83 ec 10    sub $0x10,%rsp
 4005b5: c7 45 fc 00 00 00 00 movl $0x0,-0x4(%rbp)
 4005bc: 8b 45 fc    mov -0x4(%rbp),%eax
 4005bf: 89 c6     mov %eax,%esi
 4005c1: bf 90 07 40 00   mov $0x400790,%edi
 4005c6: b8 00 00 00 00   mov $0x0,%eax
 4005cb: e8 b0 fe ff ff   callq 400480 <printf@plt>
 4005d0: c7 45 fc 39 30 00 00 movl $0x3039,-0x4(%rbp)
 4005d7: c9      leaveq
 4005d8: c3      retq

仅仅差了一条指令:

 4005b5: c7 45 fc 00 00 00 00 movl $0x0,-0x4(%rbp)

初始化的操作是依靠实实在在的指令完成的。

总结一句, 函数返回在pop出当前栈帧的时候,并不会清理它遗留在栈帧里的数据,下个函数调用再次重用到该栈帧的内存时,未初始化的局部变量将会被遗留数据影响,从而变得不确定!

所以,记得初始化你的局部变量。如果你不这样做,上帝终究会将你经理了的。

总结

到此这篇关于详解C语言未初始化的局部变量是多少的文章就介绍到这了,更多相关C语言未初始化的局部变量内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • C语言中结构体(struct)的几种初始化方法

    本文给大家总结的struct数据有3种初始化方法 1.顺序 2.C风格的乱序 3.C++风格的乱序 下面通过示例代码详细介绍这三种初始化方法. 1)顺序 这种方法很常见,在一般的介绍C的书中都有介绍.顺序初始化的特点是: 按照成员定义的顺序,从前到后逐个初始化:允许只初始化部分成员:在被初始化的成员之前,不能有未初始化的成员. 示例: struct User oneUser = {10, "Lucy", "/home/Lucy"}; 2)乱序(C风格) 顺序的缺陷是

  • 浅谈C语言中结构体的初始化

    <代码大全>建议在变量定义的时候进行初始化,但是很多人,特别是新人对结构体或者结构体数组定义是一般不会初始化,或者不知道怎么初始化.1.初始化 复制代码 代码如下: typedef struct _TEST_T {        int i;        char c[10];}TEST_T;TEST_T gst  = {1, "12345"};//可以初始化,设置i为1,s为一个字符串.TEST_T gst  = {1};//初始化个数少于实际个数时,只初始化前面的成员

  • C语言的数组学习入门之对数组初始化的操作

    数组在所有的语言中,以C最为简单,就是一起始地址,外加一数组的长度,而且基本上没有任何功能可言.然而,在所有的数组使用中,却是C的这种简单的数组形式,以其灵活性和效率,让人惊叹. C数组从逻辑上讲,是分形一致的(想不到其他词来形容了),分形的意思,就是部分与整体保持一致的构造形式,也即是数组的任何一部分也都是数组,比如一整型数组{1,2,3,4,5},连续取出其中任一连续的部分,都可以看成是一个数组,{2,3}是数组,{1,2,3}是数组,{4,5}也都是数组,差别只在于数组的起始地址和元素的个

  • C语言不定长数组及初始化方法

    C语言不支持不定长数组,要么malloc,要么在动态的指定它的长度 动态数组不能初始化,可使用memset 1.int* p = (int*)malloc(num); 2.int num = 5; arr[num]; 若使用arr[],则需要在后面对齐进行初始化,来指定长度,否则编译可以通过,但是默认只有一个单元,超过一个单元的长度,在后面程序的运行中有可能会被冲掉 int arr[] = {0}://定义了一个单元的数组,并不是不定长数组 最好不用使用arr[] = {0}来定义数组,定义数组

  • 详解C语言未初始化的局部变量是多少

    C语言中,未初始化的局部变量到底是多少? 答案往往是: 与编译器有关. 可能但不保证初始化为0. 未确定. 总之,全部都是些一本正经的形而上答案,这很令人讨厌. 但凡一些人给你滔滔不绝地扯编译器,C库,处理器体系结构却给不出一个实际场景复现问题的时候,这人大概率在扯淡. 又是周五回家时,大巴车上作短文一篇. 其实,这个问题本身就是错误的问法,说全了能讲10万字,我们只要能在特定场景下确定其特定行为就OK了,当然,这就需要设计一个比较OK的实验. 在演示一个实际代码行为之前,先给出一个知识, CP

  • 详解C语言进程同步机制

    本文是对进程同步机制的一个大总结(9000+字吐血总结),涵盖面非常的全,包括了进程同步的一些概念.软件同步机制.硬件同步机制.信号量机制和管程机制,对每种机制结合代码做了详细的介绍,并且对琐碎的知识点和概念解释的非常清晰. ​ 在前面的博客中讲述了进程的状态及其状态的转换,每种状态的含义和转换的原因.同样我们也知道,在OS引入了进程后,可以使系统中的多道程序可以并发的执行,进程的并发执行一方面极大的提高了系统的资源利用率和吞吐量,但是另一方面却使系统变得更加复杂,如果不能采取有效的措施,对多个

  • 详解C语言之缓冲区溢出

    一.缓冲区溢出原理 栈帧结构的引入为高级语言中实现函数或过程调用提供直接的硬件支持,但由于将函数返回地址这样的重要数据保存在程序员可见的堆栈中,因此也给系统安全带来隐患.若将函数返回地址修改为指向一段精心安排的恶意代码,则可达到危害系统安全的目的.此外,堆栈的正确恢复依赖于压栈的EBP值的正确性,但EBP域邻近局部变量,若编程中有意无意地通过局部变量的地址偏移窜改EBP值,则程序的行为将变得非常危险. 由于C/C++语言没有数组越界检查机制,当向局部数组缓冲区里写入的数据超过为其分配的大小时,就

  • 详解Go语言变量作用域

    作用域为已声明标识符所表示的常量.类型.变量.函数或包在源代码中的作用范围. Go 语言中变量可以在三个地方声明: 函数内定义的变量称为局部变量 函数外定义的变量称为全局变量 函数定义中的变量称为形式参数 接下来让我们具体了解局部变量.全局变量和形式参数. 局部变量 在函数体内声明的变量称之为局部变量,它们的作用域只在函数体内,参数和返回值变量也是局部变量. 以下实例中 main() 函数使用了局部变量 a, b, c: package main   import "fmt"   fu

  • 详解C语言中结构体的使用

    目录 结构体的声明 结构体成员的类型 结构体成员的访问 结构体的声明 结构体的定义:结构体是一些值的集合,这些值称为成员变量,结构体的每个成员可以是不同类型的变量. 举例: //定义结构体类型 struct tag//struct结构体关键字 tag结构体标签 struct tag结构体类型 { //成员变量 char name[20]; short age; char telphone[12]; char sex[5]; }s1,s2,s3;//s1,s2,s3是三个全局结构体变量 int m

  • 详解C语言函数返回值解析

    详解C语言函数返回值解析 程序一: int main() { int *p; int i; int*fun(void); p=fun(); for(i=0;i<3;i++) { printf("%d\n",*p); p++; } return 0; }; int* fun(void) { static int str[]={1,2,3,4,5}; int*q=str; return q; } //不能正确返回 虽然str是在动态变量区,而该动态变量是局部的,函数结束时不保留的.

  • 详解C语言 三大循环 四大跳转 和判断语句

    三大循环for while 和 do{ }while; 四大跳转 : 无条件跳转语句 go to; 跳出循环语句 break; 继续跳出循环语句 continue; 返回值语句 return 判断语句 if,if else,if else if else if...else ifelse 组合 if(0 == x) if(0 == y) error(): else{ //program code } else到底与那个if配对 C语言有这样的规定: else 始终与同一括号内最近的未匹配的if语

  • 详解C语言gets()函数与它的替代者fgets()函数

    在c语言中读取字符串有多种方法,比如scanf() 配合%s使用,但是这种方法只能获取一个单词,即遇到空格等空字符就会返回.如果要读取一行字符串,比如: I love BIT 这种情况,scanf()就无能为力了.这时我们最先想到的是用gets()读取. gets()函数从标准输入(键盘)读入一行数据,所谓读取一行,就是遇到换行符就返回.gets()函数并不读取换行符'\n',它会吧换行符替换成空字符'\0',作为c语言字符串结束的标志. gets()函数经常和puts()函数配对使用,puts

  • 详解C 语言项目中.h文件和.c文件的关系

    详解C 语言项目中.h文件和.c文件的关系 在编译器只认识.c(.cpp))文件,而不知道.h是何物的年代,那时的人们写了很多的.c(.cpp)文件,渐渐地,人们发现在很多.c(.cpp)文件中的声明语句就是相同的,但他们却不得不一个字一个字地重复地将这些内容敲入每个.c(.cpp)文件.但更为恐怖的是,当其中一个声明有变更时,就需要检查所有的.c(.cpp)文件. 于是人们将重复的部分提取出来,放在一个新文件里,然后在需要的.c(.cpp)文件中敲入#include XXXX这样的语句.这样即

  • 详解易语言的程序的输入方法概念

    为了便于输入程序,易语言内置四种名称输入法:首拼.全拼.双拼.英文.三种拼音输入法均支持南方音及多音字.首拼输入法及全拼输入法在系统中被合并为"首拼及全拼输入法",系统自动判别所输入的拼音是首拼方式还是全拼方式.双拼输入法的编码规则与 Windows 系统所提供的双拼输入法一致.例如:欲输入"取整 (1.23)"语句,各种输入法的输入文本为: ・ 首拼及全拼输入法: qz(1.23) 或者 quzheng(1.23) ・ 双拼输入法: quvg(1.23) ・ 英文

随机推荐