探究在C++程序并发时保护共享数据的问题

我们先通过一个简单的代码来了解该问题。
同步问题

我们使用一个简单的结构体 Counter,该结构体包含一个值以及一个方法用来改变这个值:

struct Counter {
  int value;

  void increment(){
    ++value;
  }
};

然后启动多个线程来修改结构体的值:

int main(){
  Counter counter;

  std::vector<std::thread> threads;
  for(int i = 0; i < 5; ++i){
    threads.push_back(std::thread([&counter](){
      for(int i = 0; i < 100; ++i){
        counter.increment();
      }
    }));
  }

  for(auto& thread : threads){
    thread.join();
  }

  std::cout << counter.value << std::endl;

  return 0;
}

我们启动了5个线程来增加计数器的值,每个线程增加了100次,然后在线程结束时打印计数器的值。

但我们运行这个程序的时候,我们是希望它会答应500,但事实不是如此,没人能确切知道程序将打印什么结果,下面是在我机器上运行后打印的数据,而且每次都不同:

442
500
477
400
422
487

问题的原因在于改变计数器值并不是一个原子操作,需要经过下面三个操作才能完成一次计数器的增加:

  • 首先读取 value 的值
  • 然后将 value 值加1
  • 将新的值赋值给 value

但你使用单线程来运行这个程序的时候当然没有任何问题,因此程序是顺序执行的,但在多线程环境中就有麻烦了,想象下下面这个执行顺序:

  • Thread 1 : 读取 value, 得到 0, 加 1, 因此 value = 1
  • Thread 2 : 读取 value, 得到 0, 加 1, 因此 value = 1
  • Thread 1 : 将 1 赋值给 value,然后返回 1
  • Thread 2 : 将 1 赋值给 value,然后返回 1

这种情况我们称之为多线程的交错执行,也就是说多线程可能在同一个时间点执行相同的语句,尽管只有两个线程,交错的现象也很明显。如果你有更多的线程、更多的操作需要执行,那么这个交错是必然发生的。

有很多方法来解决线程交错的问题:

  • 信号量 Semaphores
  • 原子引用 Atomic references
  • Monitors
  • Condition codes
  • Compare and swap

在这篇文章中我们将学习如何使用信号量来解决这个问题。信号量也有很多人称之为互斥量(Mutex),同一个时间只允许一个线程获取一个互斥对象的锁,通过 Mutex 的简单属性就可以用来解决交错的问题。

使用 Mutex 让计数器程序是线程安全的

在 C++11 线程库中,互斥量包含在 mutex 头文件中,对应的类是 std::mutex,有两个重要的方法 mutex:lock() 和 unlock() ,从名字上可得知是用来锁对象以及释放锁对象。一旦某个互斥量被锁,那么再次调用 lock() 返回堵塞值得该对象被释放。

为了让我们刚才的计数器结构体是线程安全的,我们添加一个 set:mutext 成员,并在每个方法中通过 lock()/unlock() 方法来进行保护:

struct Counter {
  std::mutex mutex;
  int value;

  Counter() : value(0) {}

  void increment(){
    mutex.lock();
    ++value;
    mutex.unlock();
  }
};

然后我们再次测试这个程序,打印的结果就是 500 了,而且每次都一样。

异常和锁

现在让我们来看另外一种情况,想象我们的的计数器有一个减操作,并在值为0的时候抛出异常:

struct Counter {
  int value;

  Counter() : value(0) {}

  void increment(){
    ++value;
  }

  void decrement(){
    if(value == 0){
      throw "Value cannot be less than 0";
    }

    --value;
  }
};

然后我们不需要修改类来访问这个结构体,我们创建一个封装器:

struct ConcurrentCounter {
  std::mutex mutex;
  Counter counter;

  void increment(){
    mutex.lock();
    counter.increment();
    mutex.unlock();
  }

  void decrement(){
    mutex.lock();
    counter.decrement();
    mutex.unlock();
  }
};

大部分时候该封装器运行挺好,但是使用 decrement 方法的时候就会有异常发生。这是一个大问题,一旦异常发生后,unlock 方法就没被调用,导致互斥量一直被占用,然后整个程序就一直处于堵塞状态(死锁),为了解决这个问题我们需要用 try/catch 结构来处理异常情况:

void decrement(){
  mutex.lock();
  try {
    counter.decrement();
  } catch (std::string e){
    mutex.unlock();
    throw e;
  }
  mutex.unlock();
}

这个代码并不难,但看起来很丑,如果你一个函数有 10 个退出点,你就必须为每个退出点调用一次 unlock 方法,或许你可能在某个地方忘掉了 unlock ,那么各种悲剧即将发生,悲剧发生将直接导致程序死锁。

接下来我们看如何解决这个问题。

自动锁管理

当你需要包含整段的代码(在我们这里是一个方法,也可能是一个循环体或者其他的控制结构),有这么一种好的解决方法可以避免忘记释放锁,那就是 std::lock_guard.

这个类是一个简单的智能锁管理器,但创建 std::lock_guard 时,会自动调用互斥量对象的 lock() 方法,当 lock_guard 析构时会自动释放锁,请看下面代码:

struct ConcurrentSafeCounter {
  std::mutex mutex;
  Counter counter;

  void increment(){
    std::lock_guard<std::mutex> guard(mutex);
    counter.increment();
  }

  void decrement(){
    std::lock_guard<std::mutex> guar(mutex);
    mutex.unlock();
  }
};

是不是看起来爽多了?

使用 lock_guard ,你不再需要考虑什么时候要释放锁,这个工作已经由 std::lock_guard 实例帮你完成。

结论

在这篇文章中我们学习了如何通过信号量/互斥量来保护共享数据。需要记住的是,使用锁会降低程序性能。在一些高并发的应用环境中有其他更好的解决办法,不过这不在本文的讨论范畴之内。

你可以在 Github 上获取本文的源码.

(0)

相关推荐

  • 如何保护MySQL中重要数据的方法

    企业最有价值的资产通常是其数据库中的客户或产品信息.因此,在这些企业中,数据库管理的一个重要部分就是保护这些数据免受外部攻击,及修复软/硬件故障. 在大多数情况下,软硬件故障通过数据备份机制来处理.多数数据库都自带有内置的工具自动完成整个过程,所以这方面的工作相对轻松,也不会出错.但麻烦却来自另一面:阻止外来黑客入侵窃取或破坏数据库中的信息.不幸的是,一般没有自动工具解决这一问题;而且,这需要管理员手工设置障碍来阻止黑客,确保公司数据的安全. 不对数据库进行保护的常见原因是由于这一工作"麻烦&q

  • 保护你的Sqlite数据库(SQLite数据库安全秘籍)

    SQLite无任何限制的授权协议以及支持大部分标准的SQL 92语句,相信会有越来越多的人使用这个数据库. PHP与SQLite的结合就如同当年的ASP与ACCESS结合一样,ACCESS可以遭遇被人恶意下载,SQLite同样不能幸免,因为SQLite也是一个二进制文件,只要WEB能访问到的,就能被下载. ACCESS可以采用一些诡计来防止用户下载,SQLite也可以.下面向大家介绍几种常用的防止SQLite被下载的方法 1.将SQLite放在WEB不能访问到的地方. 有些虚拟主机一般也都会提供

  • ASP.NET Core 数据保护(Data Protection 集群场景)下篇

    前言  接[中篇] ,在有一些场景下,我们需要对 ASP.NET Core 的加密方法进行扩展,来适应我们的需求,这个时候就需要使用到了一些 Core 提供的高级的功能. 本文还列举了在集群场景下,有时候我们需要实现自己的一些方法来对Data Protection进行分布式配置. 加密扩展  IAuthenticatedEncryptor 和 IAuthenticatedEncryptorDescriptor  IAuthenticatedEncryptor是 Data Protection 在

  • 设置密码保护的SqlServer数据库备份文件与恢复文件的方法

    设置密码保护SqlServer数据库备份文件! 备份SqlServer数据库 Backup Database [数据库] To disk='c:\mysql'+ replace(replace(replace(replace(CONVERT(varchar, getdate(), 121),'-',''),' ',''),':',''),'.','') +'.bak' With Password = '123',init; 恢复SqlServer数据库 Restore Database [数据库

  • 在ASP.NET 2.0中操作数据之七十一:保护连接字符串及其它设置信息

    导言: ASP.NET应用程序的设置信息通常都存储在一个名为Web.config的XML文件里.在教程的前面部分我们已经好几次修改过Web.config文件了.比如在第一章,我们创建名为Northwind的数据集时,数据库连接字符串信息自动的添加到Web.config文件的<connectionStrings>节点.再后来,在第3章里,我们手动更新了Web.config文件,添加了一个<pages>元素,对所有的ASP.NET页面运用DataWebControls主题. 由于Web

  • 利用MySQL加密函数保护Web网站敏感数据的方法分享

    如果您正在运行使用MySQL的Web应用程序,那么它把密码或者其他敏感信息保存在应用程序里的机会就很大.保护这些数据免受黑客或者窥探者的获取是一个令人关注的重要问题,因为您既不能让未经授权的人员使用或者破坏应用程序,同时还要保证您的竞争优势.幸运的是,MySQL带有很多设计用来提供这种类型安全的加密函数.本文概述了其中的一些函数,并说明了如何使用它们,以及它们能够提供的不同级别的安全. 双向加密 就让我们从最简单的加密开始:双向加密.在这里,一段数据通过一个密钥被加密,只能够由知道这个密钥的人来

  • 利用DOS命令来对抗U盘病毒保护U盘数据

    U盘的便捷性与大容量的存储性,深受着广大用户的欢迎,几乎每个用户都会人手一个,但就是这么广泛的使用,以至于U盘被病毒悄悄盯上,越来越多的病毒通过电脑.通过文件毁坏重要的数据,为了保护好U盘的数据,灭除U盘病毒成为了用户们的首要任务,下面就教大家一个小技巧,利用DOS命令来对抗U盘病毒. 利用DOS命令删除U盘病毒的步骤: 1.点击"开始→运行",输入"CMD",按回车键 2.打开命令提示符窗口,切换到U盘所在盘符或是中了Autorun.inf病毒的盘符下,依次执行下

  • Oracle数据库 DGbroker三种保护模式的切换

    1.三种保护模式 – Maximum protection 在Maximum protection下, 可以保证从库和主库数据完全一样,做到zero data loss.事务同时在主从两边提交完成,才算事务完成.如果从库宕机或者网络出现问题,主从库不能通讯,主库也立即宕机.在这种方式下,具有最高的保护等级.但是这种模式对主库性能影响很大,要求高速的网络连接. – Maximum availability 在Maximum availability模式下,如果和从库的连接正常,运行方式等同Maxi

  • C++多线程编程时的数据保护

    在编写多线程程序时,多个线程同时访问某个共享资源,会导致同步的问题,这篇文章中我们将介绍 C++11 多线程编程中的数据保护. 数据丢失 让我们从一个简单的例子开始,请看如下代码: #include <iostream> #include <string> #include <thread> #include <vector> using std::thread; using std::vector; using std::cout; using std::

  • ASP.NET Core 数据保护(Data Protection)上篇

    前言  上一篇记录了如何在 Kestrel 中使用 HTTPS(SSL), 也是我们目前项目中实际使用到的. 数据安全往往是开发人员很容易忽略的一个部分,包括我自己.近两年业内也出现了很多因为安全问题导致了很多严重事情发生,所以安全对我们开发人员很重要,我们要对我们的代码的安全负责. 在工作中,我们常常会见到 encode,base64,sha256, rsa, hash,encryption, md5 等,一些人对他们还傻傻分不清楚,也不知道什么时候使用他们,还有一些人认为MD5就是加密算法.

随机推荐