Linux操作文件的底层系统调用,探究父子进程是否可以共享文件问题

目录
  • open()——打开或者创建一个文件
  • write()
  • read()
  • close()
  • lseek函数
  • 应用:利用读写对文件进行复制
  • 打开文件后,fork的子进程能否共享和父进程共享访问同一个文件?
  • 总结

linux操作系统奉行一切皆文件的理念,所有文件设备几乎都可以用一套系统调用即open()/close()/write()/read()等来操作。系统调用和C库调用操作文件类似。Linux自带的man手册是最权威的。通过查看man手册来查看系统调用用法。

代号 —— 代表的含义

  • 1 —— 用户在shell环境下可操作/可执行的命令
  • 2 —— 系统内核可调用的函数与工具
  • 3 —— 一些常用的函数与函数库,大部分C的函数库
  • 4 —— 设备文件的说明,通常是在 /dev下的设备
  • 5 —— 配置文件或某些文件的格式
  • 6 —— 游戏
  • 7 —— 管理与协议等,例如Linux文件系统、网络协议等
  • 8 —— 系统管理员可用的命令
  • 9 —— 与Kernel有关的文件

注意,系统的头文件在Linux中一般存放在/usr/include目录下;下面包含的一些头文件有的带了sys,其实是include底下的子目录中的头文件

open()——打开或者创建一个文件

返回值类型: int——文件描述符fd,每打开一个文件,就会得到一个文件描述符,这个文件描述符是整形的,我们通过文件描述符进行读写操作。

  • 失败:-1
  • 成功:>= 0,即文件描述符;
  • mode_t是一个类型别名,实际上就是一个有符号的整数,对open函数而言,仅仅当创建新文件时才使用第三个参数

flag:打开标志

注意: 这些其实都是定义的一些宏,当需要使用到多个参数时,使用按位或“ | ”构成多个flag参数

也可跟随下面的方式一起使用:

其他不一一介绍,需要使用时自查。

write()

返回值

  • 若成功为已经写入的字节数;
  • 若出错为-1;

注意:计划写入的字节数和函数的返回值不相等时,表示写入出现了错误,可以用来检验写入是否成功;

参数:

  • fd:写入文件的文件描述符;
  • buf:存放待写数据的缓存;
  • count:要求写入一次数据的字节数;

注意:

对于普通文件,写操作从文件的当前位移量处开始,若如果在打开该文件时,指定了O_APPEND选择项,则在每次写操作之前,将文件位移量设置在文件的当前结尾处。在一次成功写之后,该文件位移量增加实际写的字节数。

read()

返回值 :读到的字节数

  • 若已到文件尾为0;若出错为-1;

参数

  • fd:读取文件的文件描述符;
  • buf:存放读取数据的缓存;
  • count:要求读取一次数据的字节数;注意返回值是实际读到的字节数,二者并不相同;

注意:读操作从文件的当前位移量开始,在成功返回之前,该位移量增加实际读得的字节数(这个位移量是可以自己设置的);

close()

注意:当一个进程终止时,它所打开的文件都由内核自动关闭。

注:这些不带缓存的函数都是内核提供的系统调用;这正是和我们在C语言中学到的那些IO操作不同的地方,他们不是标准C的组成部分,但是POSIX的组成部分。

标准C对文件操作时都是通过对FILE的结构体指针进行操作的,而这里使用的是文件描述符。

文件描述符的范围是0——OPEN MAX,早期的Unix采用的上限为19(即允许每个进程打开20个文件),现在很多系统将即增加到63,Linux为1024,具体多少可以在<unistd.h>的头文件中查找。

文件描述符与文件指针

  • FILE *fdopen(int fd,const char *mode),将文件描述符转为文件指针;
  • int fileno(FILE *stream),将文件指针转换为文件描述符;

lseek函数

功能: 定位一个已打开的文件

off_t lseek(int fd,off_t offset,int whence);
  • fd:已经打开的文件描述符;
  • offset:位移量;
  • whence:定位的位置,即基准点
  • SEEK_SET:将该文件的位移量设置为距文件开始处offset个字节;
  • SEEK_CUR:将该文件的位移量设置为其当前值加offset,offset可正可负;
  • SEEK_END:将该文件的位移量设置为文件长度加offset,offset可正可负(此时若为正值,就涉及到空洞文件了,请看下面的讲解);
  • 返回值:**若成功则返回新的文件位移量(绝对位移量)**若出错为-1;定位到文件尾部时,可以返回文件的大小;
  • lseek函数也可以用来确定所涉及的文件是否可以设置位移量,如果文件描述符所引用的是一个管道或者FIFO,则lseek返回-1,并将errno设置为EPLPE;

空洞文件示例:

#include<stdio.h>
#include<fcntl.h>
#include<string.h>
#include<stdlib.h>
#include<unistd.h>
#include<errno.h>

//生成空洞文件
char *buffer = "0123456789";

int main(int argc,char *argv[])
{
	if(argc < 2)
	{
		fprintf(stderr,"-usage:%s [file]\n",argv[0]);
		exit(1);
	}

	int fd = open(argv[1],O_WRONLY | O_CREATE | O_TRUNC,0777);
	if(fd < 0)
	{
		perror("open error");
		exit(1);
	}

	size_t size = strlen(buffer) * sizeof(char);
	//将字符串写入到空洞文件中
	if(write(fd,buffer,size) != size)
	{
		perror("write error");
		exit(1);
	}

	//定位到文件尾部的10个字节处
	if(lseek(fd,10L;SEERK_END) < 0)
	{
		perror("lseek error");
		exit(1);
	}
	//从文件尾部的10个字节处再写入字符串
	if(write(fd,buffer,size) != size)
	{
		perror("write error");
		exit(1);
	}
	close(fd);
	return 0;
}

我们可以看到用more命令查看文件内容时,发现显示的内容只有一次写入的结果,用od

-c命令查看文件的ASSCI码,我们会发现在两次内容之间,有10个\0,这就是空洞,用vim打开该文件内容也可以看到,有10个^@符。

注:每个文件都有一个与其相关联的“当前文件偏移量”,它是一个非负整数,用以度量从文件开始处计算的字节数。通常读写操作都以文件当前偏移量处开始,并使得偏移量增加所读或所写的字节数。按系统默认,当打开一个文件时,除非指定O_APPEND选择项,否则该文件位移量被设置为0;

示例:

运行结果如下:

fd = 3的原因是:

系统内部PCB存在一个文件表,以记录打开的文件,文件描述符其实就是文件表的下标

  • 0——FILE* stdin,标准输入
  • 1——FILE* stdout,标准输出
  • 3——FILE* stderr,标准错误输出
  • 本程序已经默认打开了三个文件,fd排到第四个,所以编号为3

接下来进行文件读取

运行结果如下:

应用:利用读写对文件进行复制

首先声明:我们不区分文本文件还是二进制文件

完成对一个图片的复制,我们可以使用以下的方案:

  • 先打开原来的二进制文件
  • 打开一个新的文件
  • 从原来的二进制文件中读取一部分写入新文件
  • 反复读写
  • 直到读完,写完就停止【read() == 0作为循环停止的条件,读不到就是读完了】
  • 完成复制

复制完成

打开文件后,fork的子进程能否共享和父进程共享访问同一个文件?

我们每次打开文件以后,会在内核中产生struct file这样一个结构体,以表示打开的文件,记录着以下信息:

  • 文件偏移量(起始从0开始,文件指针随着写入数据进行偏移)
  • 引用计数(几个进程正在使用这个打开的文件)
  • inode节点(存放进程的属性信息:谁创建了,名字是什么,在磁盘哪里存储。通过这个inode节点,我们才能找到对应的这个具体的文件)
  • 打开方式:比如只读方式,只写方式打开

测试1:先打开文件再fork

close(fd)写在最外侧,父子进程都会关闭,每关闭一次,引用计数减1,直到为0。

运行结果如下:

原因如下:

测试2:先fork再打开文件

修改代码后,运行结果发生如下变化:

因为父子进程分离后,打开了各自的文件,产生了各自的struct file,不再共享文件偏移量。

在实际的应用场景中,我们更多地使用父进程打开的文件,子进程去访问这种形式。

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持我们。

(0)

相关推荐

  • Linux之操作文件的系统调用

    目录 1.打开文件 参数介绍 2. 读文件 3. 写文件 4.关闭 分析题 练习题 系统调用和库函数的区别 需要引入的头文件: #inlcude<unistd.h> 1.打开文件 打开一个已存在的文件 int open(const char *pathname, int flags); 新建一个文件并创建权限 int open(const char *pathname, int flags, mode_t mode); 参数介绍 pathname:将要打开的文件路径和名称 flags:打开标志

  • Linux进程基础教程详解

    计算机实际上可以做的事情实质上非常简单,比如计算两个数的和,再比如在内存中寻找到某个地址等等.这些最基础的计算机动作被称为指令 (instruction).所谓的程序(program),就是这样一系列指令的所构成的集合.通过程序,我们可以让计算机完成复杂的操作.程序大多数时候被存储为可执行的文件.这样一个可执行文件就像是一个菜谱,计算机可以按照菜谱作出可口的饭菜. 那么,程序和进程(process)的区别又是什么呢? 进程是程序的一个具体实现.只有食谱没什么用,我们总要按照食谱的指点真正一步步实

  • 三种方法实现Linux系统调用

    系统调用(System Call)是操作系统为在用户态运行的进程与硬件设备(如CPU.磁盘.打印机等)进行交互提供的一组接口.当用户进程需要发生系统调用时,CPU 通过软中断切换到内核态开始执行内核系统调用函数.下面介绍Linux 下三种发生系统调用的方法: 一.通过 glibc 提供的库函数 glibc 是 Linux 下使用的开源的标准 C 库,它是 GNU 发布的 libc 库,即运行时库.glibc 为程序员提供丰富的 API(Application Programming Interf

  • Linux操作文件的底层系统调用,探究父子进程是否可以共享文件问题

    目录 open()——打开或者创建一个文件 write() read() close() lseek函数 应用:利用读写对文件进行复制 打开文件后,fork的子进程能否共享和父进程共享访问同一个文件? 总结 linux操作系统奉行一切皆文件的理念,所有文件设备几乎都可以用一套系统调用即open()/close()/write()/read()等来操作.系统调用和C库调用操作文件类似.Linux自带的man手册是最权威的.通过查看man手册来查看系统调用用法. 代号 —— 代表的含义 1 —— 用

  • python修改linux中文件(文件夹)的权限属性操作

    今天生成的对流云团路径图片放在linux下,文件的权限都是rw,没有x,后续的别人的程序调用不了,这里附上对三个属性的简单解释,有不够的欢迎大家补充 Linux的权限不是很细致,只有RWX三种 r(Read,读取):对文件而言,具有读取文件内容的权限:对目录来说,具有浏览目录的权限. w(Write,写入):对文件而言,具有新增,修改,删除文件内容的权限:对目录来说,具有新建,删除,修改,移动目录内文件的权限. x(eXecute,执行):对文件而言,具有执行文件的权限:对目录了来说该用户具有进

  • Linux中文件描述符fd与文件指针FILE*互相转换实例解析

    本文研究的主要是Linux中文件描述符fd与文件指针FILE*互相转换的相关内容,具体介绍如下. 1.文件描述符fd的定义:文件描述符在形式上是一个非负整数.实际上,它是一个索引值,指向内核为每一个进程所维护的该进程打开文件的记录表.当程序打开一个现有文件或者创建一个新文件时,内核向进程返回一个文件描述符.在程序设计中,一些涉及底层的程序编写往往会围绕着文件描述符展开.但是文件描述符这一概念往往只适用于UNIX.Linux这样的操作系统. 2.文件指针FILE定义说明文件指针的一般形式为: FI

  • Linux C中库函数与系统调用的区别详细解析

    从程序完成的功能来看,函数库提供的函数通常是不需要操作系统的服务,函数是在用户空间内执行的,除非函数涉及到I/O操作等,一般是不会切到核心态的.系统调用是要求操作系统为用户提供进程,提供某种服务,通常是涉及系统的硬件资源和一些敏感的软件资源等. 函数库的函数,尤其与输入输出相关的函数,大多必须通过Linux的系统调用来完成.因此我们可以将函数库的函数当成应用程序设计人员与系统调用程序之间的一个中间层,通过这个中间层,我们可以用一致的接口来安全的调用系统调用.这样程序员可以只要写一次代码就能够在不

  • Linux的文件描述符、文件指针、索引节点详情

    目录 Linux--文件描述符.文件指针.索引节点 一.Linux -- 文件描述符 1.文件描述符 Fd 2.系统级的文件描述符表 3.文件系统的inode表 二.文件指针 *FILE 三.索引节点 Inode 1.Inode特殊作用 四.拓展 1.磁盘结构 Linux--文件描述符.文件指针.索引节点 一.Linux -- 文件描述符 1.文件描述符 Fd 当进程打开文件或创建新文件时,内核会返回一个文件描述符(非负整数),用来指向被打开的文件,所有执行I/O操作的系统调用(read.wri

  • Linux中文件权限目录权限的意义及权限对文件目录的意义

    linux中目录与文件权限的意义 一.文件权限的意义 r:可以读这个文件的具体内容: w:可以编辑这个文件的内容,包括增加删除文件的具体内容: x:文件就具有了可执行的权限-------注意:这里和window不一样,在win中,文件的可执行权限是通过扩展名表现出来的,如exe.bat等,但是在linux中文件的可执行权限是通过这个x决定的,与文件名没有什么关系. 二.目录权限的意义 r:可以查看此目录下的完整文件列表信息. w:可以对此目录下的所有的文件及目录进行相关的更改,也就是可以更改这个

  • PHP操作文件方法问答

    PHP操作文件问答  前言:  PHP中对各类数据库的操作有着支持,对文件的操作也同样有着很丰富的操作方法,很多朋友现在的操作还是基于文件操作可是有的时候在操作文件的时候还存在不少的困惑和疑点,以下是我在日常编写过程中碰到的以及坛上朋友所碰到的关于文件操作的一些问题收藏吧.  问:如何新建一个文件?  答: 1.使用fopen("要建立的文件名","参数"),参数可选w,w+,a,a+  2.使用exec("echo '' > 要建立的文件名&quo

  • linux清空文件等有用的指令总结

    1).    > filename 2).    :> filename 3).   echo "" > filename  (文件大小被截为1字节) 4).   echo > filename 5).   cat /dev/null > filename 6).   cp /dev/null filename cat a.log >> b.log 将a中的内容append添加到b中去 cat a.log  >  b.log  将a的内容

  • Python 操作文件的基本方法总结

    Python 操作文件 编程语言对文件系统的操作是一项必不可少的功能,各种编程语言基本上都有对文件系统的操作,最简洁的莫过于linux里面shell的操作了,其次,则是python,ruby等动态语言的操作,那么,今天散仙来看下,在python里面如何使用一些常用的操作文件功能. 主要包括: 1,创建一个文件 2,删除一个文件 3,创建一个目录 4,删除一个目录 5,拷贝,重命名,查看文件大小 6,列出某个目录下文件的数量 7,递归打印某个目录下的所有文件和目录 8,读写文件操作 9,剪切,或者

随机推荐