C++单例的实现
在C++中要写一个正确的单例类实现其实也是有一定难度的,有很多过去在生产环境中被认为是正确的写法(特别是所谓的double-checked locking
写法),都被发现存在潜在的bug。本文记录一下正确的C++单例实现,以备查阅。
1. 动机
保证一个类仅有一个实例,并提供一个该实例的全局访问点。 ——《设计模式》GoF
在软件系统中,经常有这样一些特殊的类,必须保证它们在系统中只存在一个实例,才能确保它们的逻辑正确性、以及良好的效率。
所以得考虑如何绕过常规的构造器(不允许使用者new出一个对象),提供一种机制来保证一个类只有一个实例。
应用场景
-
Windows的Task Manager(任务管理器)就是很典型的单例模式,你不能同时打开两个任务管理器。Windows的回收站也是同理
-
应用程序的日志应用,一般都可以用单例模式实现,只有一个实例去操作文件
-
读取配置文件,读取的配置项是公有的,一个地方读取了所有地方都能用,没有必要所有的地方都能读取一遍配置
-
数据库连接池,多线程的线程池。
2. 单例模式的实现
下面我们给出几种单例模式的实现,并对每一种实现做相应的讲解。
2.1 实现1: 线程不安全版本
教学版,即懒汉版(Lazy Singleton):单例实例在第一次被使用时才进行初始化,这叫做延迟初始化。
这是单例模式最经典的实现方式,将构造函数和拷贝构造函数都设为私有的,而且采用了延迟初始化的方式,在第一次调用getInstance()
的时候才会生成对象,不调用就不会生成对象,不占据内存。然而,在多线程的情况下,这种方法是不安全的。
分析:正常情况下,如果线程A调用getInstance()
时,将m_instance 初始化了,那么线程B再调用getInstance()时,就不会再执行new了,直接返回之前构造好的对象。然而存在这种情况,线程A执行m_instance = new Singleton()还没完成,这个时候m_instance仍然为nullptr,线程B也正在执行m_instance = new Singleton(),这是就会产生两个对象,线程A和B可能使用的是同一个对象,也可能是两个对象,这样就可能导致程序错误。同时,还会发生内存泄漏。
2.2 实现2: 线程不安全版,解决内存泄露
Lazy Singleton存在内存泄露的问题,有两种解决方法:
-
使用智能指针
-
使用静态的嵌套类对象
对于第二种解决方法,代码如下:
在程序运行结束时,系统会调用静态成员deletor
的析构函数,该析构函数会删除单例的唯一实例。使用这种方法释放单例对象有以下特征:
-
在单例内部定义专有的嵌套类
-
在单例类内定义私有的专门用于释放的静态成员
-
利用程序在结束时析构全局变量的特性,选择最终的释放时机
在单例内再定义一个嵌套类,总是感觉很麻烦。
2.3 实现3: 线程安全,锁的代价过高
分析:这种写法不会出现上面两个线程都执行new的情况,当线程A在执行m_instance = new Singleton()的时候,线程B如果调用了getInstance()
,一定会被阻塞在加锁处,等待线程A执行结束后释放这个锁。从而是线程安全的。
但这种写法的性能不高,因为每次调用getInstance()
都会加锁释放锁,而这个步骤只有在第一次new Singleton()才是有必要的,只要m_instance被创建出来了,不管多少线程同时访问,使用if (m_instance == nullptr)
进行判断都是足够的(只是读操作,不需要加锁),没有线程安全问题,加了锁之后反而存在性能问题。
2.4 实现4: 双检查锁,由于内存读写reoder导致不安全
上面的做法是不管三七二十一,某个线程要访问的时候,先锁上再说,这样会导致不必要的锁的消耗,那么,是否可以先判断下if (m_instance == nullptr) 呢,如果满足,说明根本不需要锁啊!这就是所谓的双检查锁(DCL)的思想,DCL即double-checked locking。
上面的代码看起来很棒!只有在第一次必要的时候才会使用锁,之后就和实现一中一样了。
在相当长的一段时间,迷惑了很多人,在2000年的时候才被人发现漏洞,而且在每种语言上都发现了。原因是内存读写的乱序执行(编译器的问题)。
我们来分析,m_instance = new Singleton();
这句话可以分成三个步骤来执行:
-
1: 分配一个
Singleton
类型对象所需要的内存; -
2: 在分配的内存处构造
Singleton
类型的对象; -
3:把分配的内存地址赋给指针
m_instance
你可能会认为这三个步骤是按顺序执行的,但实际上只能确定步骤1
是最先执行的,步骤2、3却不一定。问题就出现在这。假如某个线程A
在调用执行m_instance = new Singleton()的时候是按照1、3、2
的顺序,那么刚刚执行完步骤3
给Singleton类型分配了内存(此时m_instance
就不是nullptr了)就切换到了线程B
,由于m_instance
已经不是nullptr了,所以线程B会直接执行return m_instance
得到一个对象,而这个对象并没有真正的被构造。严重的bug就这么发生了。
2.5 实现5:C++ 11版本的跨平台实现
java
和c#
发现这个问题后,就加上一个关键字volatile
,在声明m_instance
变量的时候,要加上volatile
修饰,编译器看到之后,就知道这个地方不能reorder(一定要先分配内存,再执行构造器,都完成之后再赋值)。
而对于c++标准却一直没有改正,所以VC++
在2005版本
也加入了这个关键字,但是这并不能够跨平台(只支持微软平台)。
而到了c++ 11
版本,终于有了这样的机制帮助我们实现跨平台的方案。
2.6 实现6: pthread_once函数
在linux中,pthread_once()函数可以保证某个函数只执行一次:
示例如下:
2.7 实现7: c++ 11版本最简洁的跨平台方案
实现5
的方案有点麻烦,实现6
的方案不能跨平台。其实c++ 11
中已经提供了std::call_once方法来保证函数在多线程环境中只被调用一次,同样,他也需要一个once_flag的参数。用法和pthread_once类似,并且支持跨平台。
实际上,还有一种最为简单的方案!
在C++memory model
中对static local variable,说道:
The initialization of such a variable is defined to occur the first time control passes through its declaration; for multiple threads calling the function, this means there’s the potential for a race condition to define first.
局部静态变量不仅只会初始化一次,而且还是线程安全的。
这种单例被称为Meyers' Singleton
。这种方法很简洁,也很完美,但是注意:
-
gcc 4.0之后的编译器支持这种写法。
-
C++11及以后的版本(如C++14)的多线程下,正确。
-
C++11之前不能这么写。
但是现在都18年了, 新项目一般都支持了c++11
了。
2.8 实现8: 饿汉版(Eager Singleton)
饿汉版(Eager Singleton):指单例实例在程序运行时被立即执行初始化
由于在main
函数之前初始化,所以没有线程安全的问题。但是潜在问题在于no-local static
对象(函数外的static对象)在不同编译单元中的初始化顺序是未定义的。也即,static Singleton instance;和static Singleton& getInstance()二者的初始化顺序不确定,如果在初始化完成之前调用getInstance()
方法会返回一个未定义的实例。
3. 总结
-
Eager Singleton 虽然是线程安全的,但存在潜在问题;
-
Lazy Singleton通常需要加锁来保证线程安全,但局部静态变量版本在C++11后是线程安全的;
-
局部静态变量版本(Meyers Singleton)最优雅。
[参考]