C语言中0数组\柔性数组的使用详解

前言:

上次看到一篇面试分享,里面有个朋友说,面试官问了char[0] 相关问题,但是自己没有遇到过,就绕过了这个问题。

我自己在这篇文章下面做了一些回复。

现在我想结合我自己的理解,解释一下这个 char[0] C语言柔性数组的问题。

0数组和柔性数组的介绍

0数组顾名思义,就是数组长度定义为0,我们一般知道数组长度定义至少为1才会给它分配实际的空间,而定义了0的数组是没有任何空间,但是如果像上面的结构体一样在最后一个成员定义为零数组,虽然零数组没有分配的空间,但是它可以当作一个偏移量,因为数组名这个符号本身代表了一个不可修改的地址常量。柔性数组也叫可伸缩性数组,而0数组是一种柔性数组。

因为在早期没引入0长度数组的时候, 大家是通过定长数组和指针的方式来解决的, 但是定长数组定义了一个足够大的缓冲区, 这样使用方便, 但是每次都造成空间的浪费指针的方式, 要求程序员在释放空间是必须进行多次的free操作, 而我们在使用的过程中往往在函数中返回了指向缓冲区的指针, 我们并不能保证每个人都理解并遵从我们的释放方式所以 GNU 就对其进行了0长度数组的扩展. 当使用data[0]的时候, 也就是0长度数组的时候,0长度数组作为数组名, 并不占用存储空间。这样就可以更加高效的利用内存。

在C99之后,也加了类似的扩展,只不过用的是 char payload[]这种形式(所以如果你在编译的时候确实需要用到-pedantic参数,那么你可以将char payload[0]类型改成char payload[], 这样就可以编译通过了,当然你的编译器必须支持C99标准的,如果太古老的编译器,那可能不支持了。

0数组的常规使用

首先我们定义一个结构体,再在一个结构体的最后,定义一个长度为0的数组,就可以使得这个结构体是可变长的。

如下所示:

//  0长度数组
struct zero_buffer
{
    int     len;
    char    data[0];
};

这个时候 data[0] 只是个数组名, 是不占用存储空间的.

这个结构体的大小用sizeof取长度,实际就是它的成员int的长度,data[0]不占用空间。(数组名仅仅是一个符号, 它不会占用任何空间, 它在结构体中, 只是代表了一个偏移量, 代表一个不可修改的地址常量!)

sizeof(struct zero_buffer) = sizeof(int)

printf("zero struct length is:%d int length is:%d\n",sizeof(struct zero_buffer),sizeof(int));

zero struct length is:4 int length is:4

对于0长数组的这个特点,很容易构造出我们需要的数据结构,如缓冲区,数据包等等。

结构体定义如上所示

假设我们需要设置一条tcp待发送的数据,长度是15,数据内容是"Hello My Friend",这样我们就可以按照如下去定义了。其中  zbuffer->data 为定义数据的地址,len表示数据的长度。

开辟空间之后使用

我们使用的时候, 只需要开辟一次空间即可。

#define CURR_LENGTH 15struct zero_buffer  *zbuffer = NULL;//  开辟if ((zbuffer = (struct zero_buffer *)malloc(sizeof(struct zero_buffer) + sizeof(char) * CURR_LENGTH)) != NULL){    zbuffer->len = CURR_LENGTH;    memcpy(zbuffer->data, "Hello My Friend", CURR_LENGTH);    printf("%d, %s\n", zbuffer->len, zbuffer->data);}

使用完释放空间

释放空间一次释放即可

//  销毁
free(zbuffer);
zero_buffer = NULL;

其他方法实现一些不定长数据的传输

除了0数组之外,还有使用定长数组和指针数组实现柔性数组的功能。

定长数组

定长数组顾名思义,就是在结构体里面有个定长的数组,这个数组大小是按照我们定义数据最大来进行设置的,为了就是防止数据储存的时候溢出。

定义

//  定长缓冲区
#define MAX_LENGTH      512
struct max_buffer
{
    int     len;
    char    data[MAX_LENGTH];
};

不过使用过程中,比如我要发送 512 字节的数据, 如果用定长包, 假设定长包的最大长度 MAX_LENGTH 为 1024, 那么就会浪费 512 个字节的空间, 也会造成不必要的流量浪费。如果数组结构对齐放置(这块知识详细可以看我之前的数据对齐的文章) sizeof(struct max_buffer) = sizeof(int)+ sizieof(char) * MAX_LENGTH

数据包的构造

一般来说, 我们会返回一个指向缓冲区数据结构 max_buffer 的指针.

#define CURR_LENGTH 512struct max_buffer   *mbuffer = NULL;if ((mbuffer = (struct max_buffer *)malloc(sizeof(struct max_buffer))) != NULL){    mbuffer->len = CURR_LENGTH;    memcpy(mbuffer->data, "Hello World", CURR_LENGTH);    printf("%d, %s\n", mbuffer->len, mbuffer->data);}

作者:良知犹存
链接:https://juejin.cn/post/6960470520831672333
来源:掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

前部分 4 个字节 p->len, 作为包头(就是多出来的那部分),这个包头是用来描述紧接着包头后面的数据部分的长度,这里是 1024, 所以前四个字节赋值为 1024 (既然我们要构造不定长数据包,那么这个包到底有多长呢,因此,我们就必须通过一个变量来表明这个数据包的长度,这就是len的作用),

而紧接其后的内存是真正的数据部分, 通过 p->data, 最后, 进行一个 memcpy() 内存拷贝, 把要发送的数据填入到这段内存当中

释放空间

当使用完毕释放数据的空间的时候, 直接释放就可以了

free(mbuffer);
mbuffer = NULL;

使用定长数组, 作为数据缓冲区, 为了避免造成缓冲区溢出, 数组的大小一般设为足够的空间 MAX_LENGTH, 而实际使用过程中, 达到 MAX_LENGTH 长度的数据很少, 那么多数情况下, 缓冲区的大部分空间都是浪费掉的.

但是使用过程很简单, 数据空间的开辟和释放简单, 无需程序员考虑额外的操作

指针数组

它和0数组的区别在于,零数组最后一个结构体元素定义一个data[0],而指针数组就是结构体中需要定义一个指针数组,这里面的指针数组不需要特定在结构体的最后一个元素。

struct point_buffer
{
    char    *data;
    int     len;
};

考虑数组结构对齐(这块知识详细可以看我之前的[数据对齐](https://www.jb51.net/article/211811.htm)的文章), 那么数据结构的大小 sizeof(point_buffer)= sizeof(int) + (补齐int与char * 类型的长度值)+ sizeof(char * ),在我的64位编译环境中int类型是4byte,char * 类型为8byte,所以补齐的长度为8-4,最终sizeof(point_buffer) 为16byte。

如果结构体加上  _attribute((packed))  数据对齐修饰,则 sizeof(point_buffer)= sizeof(int)  sizeof(char * ),最终计算为12byte。

空间分配使用

#define CURR_LENGTH 1024 struct point_buffer *pbuffer = NULL;if ((pbuffer = (struct point_buffer *)malloc(sizeof(struct point_buffer))) != NULL){   pbuffer->len = CURR_LENGTH;   if ((pbuffer->data = (char *)malloc(sizeof(char) * CURR_LENGTH)) != NULL)   {       memcpy(pbuffer->data, "Hello World", CURR_LENGTH);       printf("%d, %s\n", pbuffer->len, pbuffer->data);   }}

分配内存时,需采用两步

首先, 需为结构体分配一块内存空间;

其次,再为结构体中的成员变量分配内存空间.

这样两次分配的内存是不连续的, 需要分别对其进行管理. 当使用长度为的数组时, 则是采用一次分配的原则, 一次性将所需的内存全部分配给它.

释放

相反, 释放时也是一样的.

free(pbuffer->data);
free(pbuffer);
pbuffer = NULL;

使用指针结果作为缓冲区, 只多使用了一个指针大小的空间, 无需使用固定长度的数组, 不会造成空间的大量浪费.

但那是开辟空间时, 需要额外开辟数据域的空间, 施放时候也需要显示释放数据域的空间, 但是实际使用过程中, 往往在函数中开辟空间, 然后返回给使用者指向 struct point_buffer 的指针, 这时候我们并不能假定使用者了解我们开辟的细节, 并按照约定的操作释放空间, 因此使用起来多有不便, 甚至造成内存泄漏

小结:

定长数组使用方便, 但是却浪费空间, 指针形式只多使用了一个指针的空间, 不会造成大量空间分浪费, 但是使用起来需要多次分配, 多次释放。所以最优解

0数组的优劣以及注意事项

优点 :比起在结构体中声明一个指针变量、再进行动态分配的办法,这种方法效率要高。因为在访问数组内容时,不需要间接访问,避免了两次访存。此外,0数组也不会像定长数组会造成一定的内存的浪费。

缺点 :在结构体中,数组为0的数组必须在最后声明,使用上有一定限制。

总结

到此这篇关于C语言中0数组\柔性数组使用的文章就介绍到这了,更多相关C语言0数组\柔性数组内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • C语言柔性数组实例详解

    本文实例分析了C语言柔性数组的概念及用法,对于进一步学习C程序设计有一定的借鉴价值.分享给大家供大家参考.具体如下: 一般来说,结构中最后一个元素允许是未知大小的数组,这个数组就是柔性数组.但结构中的柔性数组前面必须至少一个其他成员,柔性数组成员允许结构中包含一个大小可变的数组,sizeof返回的这种结构大小不包括柔性数组的内存.包含柔数组成员的结构用malloc函数进行内存的动态分配,且分配的内存应该大于结构的大小以适应柔性数组的预期大小.柔性数组到底如何使用? 不完整类型 C和C++对于不完

  • C语言中scanf与scanf_s函数的使用详解

    目录 1.scanf_s(是vs提供的函数) 2.scanf(标准的库函数) 3.总结 1.scanf_s(是vs提供的函数) a.代码1 int main() { char a = 0; //scanf_s("%c", &a, 1); scanf_s("%c", &a, sizeof(a)); return 0; } scanf_s有三个参数,最后一个是变量a所占据空间的大小(单位为字节),这里可以写1,也可以写sizeof(a).如果a为整型的话

  • Go语言中Slice常见陷阱与避免方法详解

    目录 前言 slice 作为函数 / 方法的参数进行传递的陷阱 slice 通过 make 函数初始化,后续操作不当所造成的陷阱 性能陷阱 内存泄露 扩容 前言 Go 语言提供了很多方便的数据类型,其中包括 slice.然而,由于 slice 的特殊性质,在使用过程中易犯一些错误,如果不注意,可能导致程序出现意外行为.本文将详细介绍 使用 slice 时易犯的一些错误,帮助读者更好的使用 Go 的 slice,避免犯错误. slice 作为函数 / 方法的参数进行传递的陷阱 slice 作为参数

  • C语言中access/_access函数的使用实例详解

    在Linux下,access函数的声明在<unistd.h>文件中,声明如下: int access(const char *pathname, int mode); access函数用来判断指定的文件或目录是否存在(F_OK),已存在的文件或目录是否有可读(R_OK).可写(W_OK).可执行(X_OK)权限.F_OK.R_OK.W_OK.X_OK这四种方式通过access函数中的第二个参数mode指定.如果指定的方式有效,则此函数返回0,否则返回-1. 在Windows下没有access函

  • Go语言中strings和strconv包示例代码详解

    前缀和后缀 HasPrefix判断字符串s是否以prefix开头: strings.HaxPrefix(s string, prefix string) bool 示例: package main import ( "fmt" "strings" ) func main() { pre := "Thi" str1 := "This is a Go program!" fmt.Println(strings.HasPrefix(

  • Go语言中io.Reader和io.Writer的详解与实现

    一.前言 也许对这两个接口和相关的一些接口很熟悉了,但是你脑海里确很难形成一个对io接口的继承关系整天的概貌,原因在于godoc缺省并没有像javadoc一样显示官方库继承关系,这导致了我们对io接口的继承关系记忆不深,在使用的时候还经常需要翻文档加深记忆. 本文试图梳理清楚Go io接口的继承关系,提供一个io接口的全貌. 二.io接口回顾 首先我们回顾一下几个常用的io接口.标准库的实现是将功能细分,每个最小粒度的功能定义成一个接口,然后接口可以组成成更多功能的接口. 最小粒度的接口 typ

  • Java语言中flush()函数作用及使用方法详解

    最近在学习io流,发现每次都会出现flush()函数,查了一下其作用,起作用主要如下 //------–flush()的作用--------– 笼统且错误的回答: 缓冲区中的数据保存直到缓冲区满后才写出,也可以使用flush方法将缓冲区中的数据强制写出或使用close()方法关闭流,关闭流之前,缓冲输出流将缓冲区数据一次性写出.flash()和close()都使数据强制写出,所以两种结果是一样的,如果都不写的话,会发现不能成功写出 针对上述回答,给出了精准的回答 FileOutPutStream

  • 汇编语言中mov和lea指令的区别详解

    指令(instruction)是一种语句,它在程序汇编编译时变得可执行.汇编器将指令翻译为机器语言字节,并且在运行时由 CPU 加载和执行. 一条指令有四个组成部分: 标号(可选) 指令助记符(必需) 操作数(通常是必需的) 注释(可选) 最近在学习汇编语言,过程中遇到很多问题,对此在以后的随笔会逐渐更新,这次谈谈mov,lea指令的区别   一,关于有没有加上[]的问题 1,对于mov指令来说: 有没有[]对于变量是无所谓的,其结果都是取值 如: num dw 2 mov bx,num mov

  • C语言中typedef的用法以及#define区别详解

    目录 1.简洁定义 2.为已有类型起别名 为字符数组起别名 为指针起别名 3.typedef 和 #define 的区别 总结 1.简洁定义 C语言允许为一个数据类型起一个新的别名,就像给人起"绰号"一样.而编程中起别名,是为了编程人员编程方便,例如: 定义如下结构体 struct stu { int ID; char name[20]; float score[3]; char *data; }; 要想定义一个结构体变量就得这样写: struct stu Marry://Marry是

  • Rust语言中的String和HashMap使用示例详解

    目录 String 新建字符串 更新字符串 使用 + 运算符或 format! 宏拼接字符串 索引字符串 字符串 slice 遍历字符串 HashMap 新建 HashMap HashMap 和 ownership 访问 HashMap 中的值 更新 HashMap 直接覆盖 新插入 更新旧值 总结 String 字符串是比很多开发者所理解的更为复杂的数据结构.加上 UTF-8 的不定长编码等原因,Rust 中的字符串并不如其它语言中那么好理解. Rust 的核心语言中只有一种字符串类型:str

  • R语言中的fivenum与quantile()函数算法详解

    fivenum()函数: 返回五个数据:最小值.下四分位数数.中位数.上四分位数.最大值 对于奇数个数字=5,fivenum()先排序,依次返回最小值.下四分位数.中位数.上四分位数.最大值 > fivenum(c(1,12,40,23,13)) [1] 1 12 13 23 40 对于奇数个数字>5,fivenum()先排序,我们可以求取最小值,最大值,中位数.在排序中,最小值与中位数中间,若为奇数,取其中位数为下四分位数,若为偶数,取最中间两个数的平均值为下四分位数:在排序中,中位数与最大

随机推荐