C语言中数据在内存如何存储

目录
  • 数据类型
  • 类型的基本归类
    • 整形
    • 浮点型
    • 构造类型(自定义类型)
    • 指针类型
    • 空类型
  • 整形在内存中的存储
    • 大小端字节序
    • 储存时数据发生截断以及整型提升
  • 浮点型在内存中的存储
    • 浮点型和整形在内存中的储存方式不同
    • 拿出这些储存的数据(三种情乱)
      • 情况一:E不全为0或不为全1
      • 情况二:E全为0
      • 情况三:E为全1

数据类型

常见的数据类型

常见的数据类型 字节
char 字符数据类型 1
short 短整型 2
int 整形 4
long 长整型 4
long long 更长的整形 8
float 浮点型 4
double 双精度浮点型 8

注意:

  • C语言里面没有字符串类型
  • 关于int和long的大小:C语言只是规定了:sizeof(long)>=sizeof(int)
  • 布尔类型(_Bool)(C99引入)专门用来表示真假,但是在C语言中不需要布尔类型也可以表示真假
#include<stdbool.h>
int main()
{
    _Bool flag = false;
    _Bool flag2 = true;
    if(flag)
    {
        printf("haha\n");
	}
    if(flag2)
    {
        printf("hehe\n");
	}
return 0;
}//只打印了hehe

类型的基本归类

整形

char也属于整形(每一个字符在储存的时候是储存他所对应的ascll值,ascll是整数)

char unsigned char signed char
short unsigned short signed short
int unsigned int signed int
long unsigned long signed long

有符号数和无符号数

有符号数

int main()
{
	int a = 10;
    int a = -10;
	return 0;
}//a是一个有符号数,它可以储存正负整数

//int ===> signed int
//short ===> signed short
//long ===> signed long

无符号数

有一些变量只有正数由意义,例如年龄,价格。定义这些变量的时候就可以用无符号数定义 ,无符号数只能存储正数。

int main()
{
    unsigned int a = 10;
    //无符号变量只能储存正数
    a = -10;
    //即使这里输入了一个负数,它也会把这个负数转化成一个正数(不是简单的去掉符号,这是关于二进制的计算)
    return 0;
}

是否char 等于signed char呢?

答案:取决于编译器

  • 我们会发现这样一件事:
    int 就是 signed int
    short 就是 signed short
    long 就是 signed long
  • char 等于signed char还是unsigned char 取决于编译器,不同的编译器可能是不同的结果,常见的编译器下是等于signed char

对于有符号数字和无符号数字的打印

打印无符号数应该用%u

%u和%d打印的解读方式不同:

  • 使用%d 时,会认为这是一个有符号数,打印的时候会认为二进制中第一位是符号位;
  • 使用%u时,会认为这是一个无符号数据,会认为整个二进制序列都是有效位。
#include<stdio.h>
int main()
{
    unsigned int a = 10;
    printf("%u",a);//正确的形式

    //如果存储了一个-10进去会怎么样
    a = -10;
    printf("%u",a);
    //会打印4294967286,而这个数据不是随机数
    return 0;
}

为什么无符号整形储存 -10 的时候会打印出来4284967286(并不是随机数)?

%u在解读的时候认为此时a仍然存储的是正数,解读了a的补码。在本章后面介绍原反补吗的时候在详细解释细节。

浮点型

浮点型 大小
float 4
double 8

构造类型(自定义类型)

构造类型
数组 数组名去掉后剩下的就是数组的类型
结构体 struct
枚举类型 enum
联合(联合体)类型 union

指针类型

指针类型
char* pc
int * pi
float* pf
void* pv

空类型

void表示空类型(无类型)

通常应用于函数的返回类型,函数的参数,指针类型

整形在内存中的存储

int a = 10;
int b = -10;

然后我们观察a、b在内存中的储存

数据在内存里面是以二进制储存的,但是编译器是以十六进制展现给我们看的:

a在内存中的值是 :0a 00 00 00

b在内存中的值是: f6 ff ff ff

为什么是这样的值呢?下面介绍整数的原码、反码、补码。

原码,反码,补码

整数二进制有3种表示形式,而内存中存储的是二进制的补码

例如 1 的原码:

00000000 00000000 00000000 00000001

正整数

正整数的原码、反码和补码相同

负整数

  • 原码:按照一个数的正负直接写出来的二进制就是原码
  • 反码:符号位不变,其他位按位取反 (并不是按位取反)
  • 补码:反码的二进制序列加1

从原码转换成补码:先取反再加一。

从补码转换成原码:可以先减一再取反,也可以先取反再加一(和原码转换成补码的过程相同)。

类型 数据:15 数据:-15
原码 00000000 00000000 00000000 00001111 10000000 00000000 00000000 00001111
反码 00000000 00000000 00000000 00001111 11111111 11111111 11111111 11110000
补码 00000000 00000000 00000000 00001111 11111111 11111111 11111111 11110001

解释为什么%u打印-10;会出现4294967286

用上面的方法我们就可以计算出-10的补码:

数据 补码
10 11111111 11111111 11111111 11110110

回到最开始使用%u打印-10会打印成4294967286,是因为在使用%u的时候,不会解读符号位,会将整个32位二进制都当作有效位,读出一个数据,而这个数据就是4294967286。

同时回到刚才a,b的值

int main()
{
int a = 10;
int b = -10;
    //a: 00000000 00000000 00000000 00001010
    //b: 11111111 11111111 11111111 11110110
}
//四个二进制位转换成一个十六进制位
//a: 00 00 00 0a
//b: ff ff ff f6

为什么和在内存界面看到的不同呢?

内存界面和我们计算出来的顺序是相反的:

数据 计算结果 内存
10 00 00 00 0a 0a 00 00 00
-10 ff ff ff f6 f6 ff ff ff

为什么会倒着存进去?

这就和字节序有关,下面我们来了解字节序

大小端字节序

当储存的内容超过一个字节的时候,储存的时候就有顺序

(一个char类型的数据是没有字节序。char类型的数据只有一个字节,没有顺序)

机器有两种对字节的存储顺序:

  • 大端字节序存储:
    低字节数据存放在高地址处,高字节数据存放在低地址处
  • 小端字节序存储
    低字节数据存放在低地址处,高字节数据存放在高地址处

我们用下面这个例子来解释:

int main()
{
    int a = 0x11223344;//0x开头说明是十六进制数字
    //再内存界面看到:44 33 22 11

    return 0;
}

而我在观察内存的时候发现我的机器是按照方式2进行存储的,所以我的机器是采用的小端字节序。

那么有什么方法可以快速判断自己当前使用的机器属于哪一种字节序呢?

设计一个小程序判断当前机器属于哪种字节序

#include<stdio.h>
int main()
{
    int a = 1;
    //a的十六进制是 00 00 00 01
    //如果是大端那么内存中为:00 00 00 01
    //如果是小端那么内存中为:01 00 00 00
    //只需要判断第一个字节的内容是不是1
    char*pc = (char*)&a;
    //强制类型转换截取了a的第一个字节
    if(*pc)//也可以是:if(*(char*)&a)
    {
        printf("小端");
	}
    else
    {
        printf("大端");
	}

	return 0;
}

储存时数据发生截断以及整型提升

例题1

int main()
{
	char a = -1;
	signed char b = -1;
	unsigned char c = -1;
	printf("%d %d %d ",a,b,c);//会打印出-1 -1 255
    return 0;
}

解释:

  • 第一步:
    这里我们将三个相同的整数 -1 分别存进了两种类型的变量,(在我所使用的VS2019编译器下char和signed char等价),而这两种类型又都属于char类型
  • 第二步:
    char 类型的变量只能储存一个字节(8个比特位)大小的数据,但是 -1 是整形(包含32个比特位),
    这里就需要发生数据截断: -1 的二进制补码是11111111 11111111 11111111 11111111
    截断:将补码的最后八位赋值给变量a、b、c。
  • 第三步:
    这里需要将char类型的数据以%d的方式打印,但是%d只能解读整数数据(整数有四个字节),而char类型的三个变量都只有一个字节,所以这里会发生整型提升:
    整形提升:对于有符号数据,高位补符号位,对于无符号数据:高位补0
数据(变量) 整形提升前 整形提升后(补码) 原码代表的数据
a/b 11111111 11111111 11111111 11111111 11111111 -1
c 11111111 00000000 00000000 00000000 11111111 255

%d打印的时候会认为这就是要打印数据的补码,按照打印正常整数的形式打印这三个变量

例题2

#include<stdio.h>
int main()
{

    char a = -128;
    printf("%u",a);//会打印4294967168
    return 0;
}

解释:

  • 第一步:
    观察数据: -128 是一个整数,二进制有32位 : 但是接受这个数据的变量是一个char类型的变量(只能接受8个比特位)
  • 第二步:
    数据的截断:
数据 二进制(补码) 截取(a储存的部分)
-128 11111111 11111111 11111111 10000000 10000000

联想:这里如果是a = 128,那么阶段后的值仍然是10000000

  • 第三步:
    打印整数(四个字节),所以这里需要发生整形提升(a是有符号char,高位补符号位)
数据(变量) 整形提升前 整形提升后(补码)
a 10000000 11111111 11111111 11111111 10000000
  • 第四步:
    %u的形式打印这个变量,因为%u应该打印的是无符号整数,且打印的时候认为整个32位全为有效位,
    就会打印出4294967168

浮点型在内存中的存储

常见的浮点数 例子
字面浮点数 3.14159
科学计数法的表示形式 1E10(1乘以10的10次方)

注意:

  • 在浮点型数据后面加了f是float类型,不加则默认是double类型
  • %f和%lf默认小数点后六位

浮点型和整形在内存中的储存方式不同

我们通过下面这个例题来探究浮点型和整形在内存中的储存方式有什么不同

#include<stdio.h>
int main()
{

	int n = 9;
	float* pf = (float*)&n;
    //第一组
	printf("n = %d\n", n);    //打印出:9
	printf("*pf = %f\n", *pf);//打印出:0.000000
	//第二组
	*pf = 9.0;
	printf("n = %d\n", n);	  //打印出:1091567616
	printf("*pf = %f\n", *pf);//打印出:9.000000

	return 0;
}

为什么会出现这样的情况?

回答这个问题前,先来了解浮点型的二进制存储形式:

国际标准电气电子工程师学会(IEEE):任何一个二进制浮点数V都可以表示成下面的形式

  • 表示形式:(-1)^S * M * 2^E
  • (-1)^S表示符号位,当S为0 时表示正数,当S为1时,表示负数
  • M表示有效数字,大于等于1,小于等于2
  • 2^E表示指数位
(5.5)十进制 (5.5)二进制
5.5 101.1
5.5*(10^1) 1.011*(2^2)
十进制浮点数:5.5
转化成二进制:101.1
可以写成:(-1)^0 * 1.011 * (2^2)
S = 0
M = 1.011
E = 2
只需要储存SME三个值
  • IEEE浮点数标准定义了两种基本的格式:以四个字节表示的的单精度格式和八个字节表示的双精度格式

单精度浮点数储存格式(32位)

第一位 接着8位 剩下23位
符号位 指数位 有效位

双精度浮点数储存格式(64位)

第一位 接着11位 剩下52位
符号位 指数位 有效位

IEEE754对于有效数字M和指数E有一些特别的规定:

  • 关于M:
    1.我们已经知道1<=M<2,也即是说M一定可以写成这样的形式:1.xxxxxx
    其中xxxxxx表示小数点后面的部分
    2.在计算机内部储存M时,由于第一位总是1,所以把这个1省略,只保存后面的小数部分,这样可以节约一位有效数字,这样的话储存的数据精度就可以提升一位:例如在单精度浮点型存储格式中,最后23位作为有效位,但是储存在计算机的数据精度是24位
  • 关于E:
    计算机会认为这是一个无符号数,但是十几行会存在很多E取负数的情况,所以IEEE754规定:存入内存时,E的真实值必须在加上一个中间数 ,对于单精度,这个中间数(也叫做偏移量)是127,对于双精度,这个中间数是1023
    例如:对于十进制的数字0.5,它的二进制是0.1,E= -1;那么我们就需要把-1在加上127得到126后,将126储存在指数位

拿出这些储存的数据(三种情乱)

情况一:E不全为0或不为全1

  • E: 指数位值减去127(1023)得到真实值
  • M: 有效位的数值前面加上1.

情况二:E全为0

  • E:
    真实的E是一个十分小的数字,接近0;
    这时候不用计算,E直接就等于1-127(1-1023)就是它的真实值
  • M:
    M不再在前面加上1,而是还原成0.XXXXXX的小数,这样做是为了表示正负0,以及接近于0的很小的数字。

情况三:E为全1

  • 真实的E是一个十分大的数字,代表正负无穷大的数字

解释上面的例子

  • 第一组为什么以%f打印整数9,会打印出0.000000?

原因:

此时E为全0,是一个会被判定成一个十分小的数据,所以打印0.000000

  • 为什么第二组中以%d的形式打印*pf时,会打印出1091567616?

(0)

相关推荐

  • 关于C语言中数据在内存中的存储详解

    前言 1. 数据类型详细介绍 2. 整形在内存中的存储:原码.反码.补码 3. 大小端字节序介绍及判断 4. 浮点型在内存中的存储解析 一.数据类型介绍 1.类型的基本归类 1.整形家族 char unsigned char signed char short unsigned short [int] signed short [int] int unsigned int signed int long unsigned long [int] signed long [int] 2.浮点型家族

  • C语言数据在内存中的存储详解

    目录 文章摘要 一.C语言的数据类型 数据类型基本分为: 二.隐式类型转换 1.什么是隐式类型转换 2.整型提升 3.类型转换 三.机器大小端 1.什么是大小端 2.大小端在截断的应用 3.判断当前机器的字节序是大端还是小端 四.整型在内存中的存储 1.原码.反码.补码 2.举例实践整型数据在内存的存储 总结 文章摘要 本文通过内存底层原理,帮你透彻了解数据存储进内存与从内存中读取的区别以及不同数据类型下数据计算.赋值的变化情况 要透彻理解这些,必须知道隐式类型转换以及机器大小端的概念,本文会对

  • C语言数据(整数、浮点数)在内存中的存储

    本篇主要讨论:整数.浮点数在内存中是怎么保存的! 数据类型详细介绍 在前面C语言基础概览中,已经提到过了基本的C语言内置类型,但C语言的数据类型有无数种~ 但是可以把这些类型分为几个大类: 类型的归类: 存整数的 char,short,int,long,long long及所配套的unsigned,int*,int[]- 2.存浮点数的 float,double,float[]- 结构体(结构体在内存中的存储后面在进行讨论~) 整数在内存种的存储: 1.字节序 2.补码 内存窗口 调试模式下的内

  • C语言编程数据在内存中的存储详解

    目录 变量在计算机中有三种表示方式,原码反码,补码 原码 反码 补码 总结一下 浮点数在内存的储存 C语言中,有几种基本内置类型. int unsigned int signed int char unsigned char signed char long unsigned long signed long float double 在内存中创建变量,会在内存中开辟空间,并为其赋值. int a=10; 在计算机中,所有数据都是以二进制的形式存储在内存中. 变量在计算机中有三种表示方式,原码反

  • C语言中数据在内存如何存储

    目录 数据类型 类型的基本归类 整形 浮点型 构造类型(自定义类型) 指针类型 空类型 整形在内存中的存储 大小端字节序 储存时数据发生截断以及整型提升 浮点型在内存中的存储 浮点型和整形在内存中的储存方式不同 拿出这些储存的数据(三种情乱) 情况一:E不全为0或不为全1 情况二:E全为0 情况三:E为全1 数据类型 常见的数据类型 常见的数据类型 字节 char 字符数据类型 1 short 短整型 2 int 整形 4 long 长整型 4 long long 更长的整形 8 float 浮

  • C语言中数据是如何存储在内存中的

    目录 前言 ‍数据类型介绍 ‍整形数据在内存中存储 ‍浮点型数据在内存存储 前言 在计算机内存中,数据的存储方式都是以0和1的形式存储,也就是二进制的形式,数据是如何向内存写入的呢?整形数据以补码的形式存储,浮点型的存储规则较多,类似于科学计数法. ‍数据类型介绍 为什么需要有这些数据类型? 数据类型解决了数据存储的问题. ‍整形数据在内存中存储 整数中有三种二进制表示形式,分别是原码.反码.补码,正整数的原码 = 反码 = 补码,通常取最高位作为符号位. 原码:直接将正负整数按照二进制形式转换

  • C语言中数据如何存储进内存揭秘

    目录 内存简单介绍 整数与字符在内存中的存储 浮点数在内存中的存储 大小端存储模式及简介 总结 内存简单介绍 大家肯定经常听说内存这个词,内存到底是什么呢? 在计算机中,进程都要加载进内存中,也是我们各种数据的流通途径,C语言中,大家肯定都知道指针变量,指针变量中保存的就是内存的地址,那么,什么是内存的地址呢? 内存的单位是字节 对于32位的机器,有32根地址线,每根地址线在寻址时,产生的高低电压分别为0/1,那么32根地址线产生的地址就会是 00000000000000000000000000

  • 深度解析C语言中数据的存储

    目录 前言 数据类型介绍 类型的基本归类 整型家族 浮点数家族 构造类型 指针类型 空类型 前言 在VS编译器里有release和debug两种形式,debug包含调试信息,release不包含调试信息,并会对程序进行优化 int main() { int i = 0; int arr[10] = { 1,2,3,4,5,6,7,8,9,10 }; for (i = 0; i <= 12; i++) { arr[i] = 0; printf("hehe\n"); } return

  • 一文带你了解C语言中的动态内存管理函数

    目录 1.什么是动态内存管理 2.为什么要有动态内存管理 3.如何进行动态内存管理 3.1 malloc 3.2 free 3.3 calloc 3.4 realloc 总结 1.什么是动态内存管理 平时我们写代码,一种非常常见的写法是: int a = 0; // 创建一个变量 int arr[10] = {0}; // 创建一个数组 当你创建变量a的时候,其实是向内存中申请了4个字节的空间来存放一个整数.而当你创建数组arr的时候,是向内存中申请了40个字节的空间来存放10个整数.当你这么写

  • C语言中关于动态内存分配的详解

    目录 一.malloc 与free函数 二.calloc 三.realloc 四.常见的动态内存的错误 [C语言]动态内存分配 本期,我们将讲解malloc.calloc.realloc以及free函数. 这是个动态内存分配函数的头文件都是 <stdlib.h>. c语言中动态分配内存的函数,可能有些初学c语言的人不免要问了:我们为什么要通过函数来实现动态分配内存呢? 首先让我们熟悉一下计算机的内存吧!在计算机的系统中大致有这四个内存区域: 1)栈:在栈里面储存一些我们定义的局部变量以及形参(

  • 深入了解C语言中的动态内存分配

    目录 什么是动态内存分配 如何进行动态内存分配 首先我要介绍两个函数 malloc 和 free 第二个开辟空间的动态内存分配的函数 calloc 大小修改函数realloc 今天我们来学习一下C语言中的动态内存分配 开始学习吧 什么是动态内存分配 我们目前已经知道的内存开辟的方式有: int val = 20;//在栈上开辟四个字节. char arr[10] = { 0 };//在栈上开辟十个字节的连续空间 但是上述空间的开辟方式有两个特点: 1.空间开辟的大小是固定的 2.数组在申明的时候

  • 详解C语言中的动态内存管理

    目录 一.动态内存管理 1.1为什么要有动态内存管理 1.2动态内存介绍 1.3常见的动态内存错误 一.动态内存管理 1.1为什么要有动态内存管理 1.1.1  在c语言中我们普通的内存开辟是直接在栈上进行开辟的 int i = 20;//在栈空间上开辟四个字节 int arr[10]={0}; //在栈中连续开辟四十个字节 这样开辟的特点是: (1)他所开辟的空间是固定的 (2)数组在申明的时候,必须指定数组的长度,它所需要的内存在编译时分配 但对于空间的需求,我们有的时候并不知道,有可能空间

随机推荐