C++中智能指针如何设计和使用
智能指针(smart pointer)是存储指向动态分配(堆)对象指针的类,用于生存期控制,能够确保自动正确的销毁动态分配的对象,防止内存泄露。它的一种通用实现技术是使用引用计数(reference count)。智能指针类将一个计数器与类指向的对象相关联,引用计数跟踪该类有多少个对象共享同一指针。每次创建类的新对象时,初始化指针并将引用计数置为1;当对象作为另一对象的副本而创建时,拷贝构造函数拷贝指针并增加与之相应的引用计数;对一个对象进行赋值时,赋值操作符减少左操作数所指对象的引用计数(如果引用计数为减至0,则删除对象),并增加右操作数所指对象的引用计数;调用析构函数时,构造函数减少引用计数(如果引用计数减至0,则删除基础对象)。
智能指针就是模拟指针动作的类。所有的智能指针都会重载 -> 和 * 操作符。智能指针还有许多其他功能,比较有用的是自动销毁。这主要是利用栈对象的有限作用域以及临时对象(有限作用域实现)析构函数释放内存。当然,智能指针还不止这些,还包括复制时可以修改源对象等。智能指针根据需求不同,设计也不同(写时复制,赋值即释放对象拥有权限、引用计数等,控制权转移等)。auto_ptr 即是一种常见的智能指针。
智能指针通常用类模板实现:
代码如下:
template <class T>
class smartpointer
{
private:
T *_ptr;
public:
smartpointer(T *p) : _ptr(p) //构造函数
{
}
T& operator *() //重载*操作符
{
return *_ptr;
}
T* operator ->() //重载->操作符
{
return _ptr;
}
~smartpointer() //析构函数
{
delete _ptr;
}
};
实现引用计数有两种经典策略,在这里将使用其中一种,这里所用的方法中,需要定义一个单独的具体类用以封装引用计数和相关指针:
代码如下:
// 定义仅由HasPtr类使用的U_Ptr类,用于封装使用计数和相关指针
// 这个类的所有成员都是private,我们不希望普通用户使用U_Ptr类,所以它没有任何public成员
// 将HasPtr类设置为友元,使其成员可以访问U_Ptr的成员
class U_Ptr
{
friend class HasPtr;
int *ip;
size_t use;
U_Ptr(int *p) : ip(p) , use(1)
{
cout << "U_ptr constructor called !" << endl;
}
~U_Ptr()
{
delete ip;
cout << "U_ptr distructor called !" << endl;
}
};
HasPtr类需要一个析构函数来删除指针。但是,析构函数不能无条件的删除指针。”
条件就是引用计数。如果该对象被两个指针所指,那么删除其中一个指针,并不会调用该指针的析构函数,因为此时还有另外一个指针指向该对象。看来,智能指针主要是预防不当的析构行为,防止出现悬垂指针。
如上图所示,HasPtr就是智能指针,U_Ptr为计数器;里面有个变量use和指针ip,use记录了*ip对象被多少个HasPtr对象所指。假设现在又两个HasPtr对象p1、p2指向了U_Ptr,那么现在我delete p1,use变量将自减1, U_Ptr不会析构,那么U_Ptr指向的对象也不会析构,那么p2仍然指向了原来的对象,而不会变成一个悬空指针。当delete p2的时候,use变量将自减1,为0。此时,U_Ptr对象进行析构,那么U_Ptr指向的对象也进行析构,保证不会出现内存泄露。
包含指针的类需要特别注意复制控制,原因是复制指针时只复制指针中的地址,而不会复制指针指向的对象。
大多数C++类用三种方法之一管理指针成员
(1)不管指针成员。复制时只复制指针,不复制指针指向的对象。当其中一个指针把其指向的对象的空间释放后,其它指针都成了悬浮指针。这是一种极端
(2)当复制的时候,即复制指针,也复制指针指向的对象。这样可能造成空间的浪费。因为指针指向的对象的复制不一定是必要的。
(3) 第三种就是一种折中的方式。利用一个辅助类来管理指针的复制。原来的类中有一个指针指向辅助类,辅助类的数据成员是一个计数器和一个指针(指向原来的)(此为本次智能指针实现方式)。
其实,智能指针的引用计数类似于java的垃圾回收机制:java的垃圾的判定很简答,如果一个对象没有引用所指,那么该对象为垃圾。系统就可以回收了。
HasPtr 智能指针的声明如下,保存一个指向U_Ptr对象的指针,U_Ptr对象指向实际的int基础对象,代码如下:
代码如下:
#include<iostream>
using namespace std;
// 定义仅由HasPtr类使用的U_Ptr类,用于封装使用计数和相关指针
// 这个类的所有成员都是private,我们不希望普通用户使用U_Ptr类,所以它没有任何public成员
// 将HasPtr类设置为友元,使其成员可以访问U_Ptr的成员
class U_Ptr
{
friend class HasPtr;
int *ip;
size_t use;
U_Ptr(int *p) : ip(p) , use(1)
{
cout << "U_ptr constructor called !" << endl;
}
~U_Ptr()
{
delete ip;
cout << "U_ptr distructor called !" << endl;
}
};
class HasPtr
{
public:
// 构造函数:p是指向已经动态创建的int对象指针
HasPtr(int *p, int i) : ptr(new U_Ptr(p)) , val(i)
{
cout << "HasPtr constructor called ! " << "use = " << ptr->use << endl;
}
// 复制构造函数:复制成员并将使用计数加1
HasPtr(const HasPtr& orig) : ptr(orig.ptr) , val(orig.val)
{
++ptr->use;
cout << "HasPtr copy constructor called ! " << "use = " << ptr->use << endl;
}
// 赋值操作符
HasPtr& operator=(const HasPtr&);
// 析构函数:如果计数为0,则删除U_Ptr对象
~HasPtr()
{
cout << "HasPtr distructor called ! " << "use = " << ptr->use << endl;
if (--ptr->use == 0)
delete ptr;
}
// 获取数据成员
int *get_ptr() const
{
return ptr->ip;
}
int get_int() const
{
return val;
}
// 修改数据成员
void set_ptr(int *p) const
{
ptr->ip = p;
}
void set_int(int i)
{
val = i;
}
// 返回或修改基础int对象
int get_ptr_val() const
{
return *ptr->ip;
}
void set_ptr_val(int i)
{
*ptr->ip = i;
}
private:
U_Ptr *ptr; //指向使用计数类U_Ptr
int val;
};
HasPtr& HasPtr::operator = (const HasPtr &rhs) //注意,这里赋值操作符在减少做操作数的使用计数之前使rhs的使用技术加1,从而防止自我赋值
{
// 增加右操作数中的使用计数
++rhs.ptr->use;
// 将左操作数对象的使用计数减1,若该对象的使用计数减至0,则删除该对象
if (--ptr->use == 0)
delete ptr;
ptr = rhs.ptr; // 复制U_Ptr指针
val = rhs.val; // 复制int成员
return *this;
}
int main(void)
{
int *pi = new int(42);
HasPtr *hpa = new HasPtr(pi, 100); // 构造函数
HasPtr *hpb = new HasPtr(*hpa); // 拷贝构造函数
HasPtr *hpc = new HasPtr(*hpb); // 拷贝构造函数
HasPtr hpd = *hpa; // 拷贝构造函数
cout << hpa->get_ptr_val() << " " << hpb->get_ptr_val() << endl;
hpc->set_ptr_val(10000);
cout << hpa->get_ptr_val() << " " << hpb->get_ptr_val() << endl;
hpd.set_ptr_val(10);
cout << hpa->get_ptr_val() << " " << hpb->get_ptr_val() << endl;
delete hpa;
delete hpb;
delete hpc;
cout << hpd.get_ptr_val() << endl;
return 0;
}
这里的赋值操作符比较麻烦,且让我用图表分析一番:
假设现在又两个智能指针p1、 p2,一个指向内容为42的内存,一个指向内容为100的内存,如下图:
现在,我要做赋值操作,p2 = p1。对比着上面的
此时,rhs就是p1,首先将p1指向的ptr的use加1,
代码如下:HasPtr& operator=(const HasPtr&); // 赋值操作符
然后,做:
代码如下:++rhs.ptr->use; // 增加右操作数中的使用计数
因为,原先p2指向的对象现在p2不在指向,那么该对象就少了一个指针去指,所以,use做自减1;
代码如下:if (--ptr->use == 0)
delete ptr;
此时,条件成立。因为u2的use为1。那么,运行U_Ptr的析构函数,而在U_Ptr的析构函数中,做了delete ip操作,所以释放了内存,不会有内存泄露的问题。
接下来的操作很自然,无需多言:
做完赋值操作后,那么就成为如下图所示了。红色标注的就是变化的部分:
代码如下:ptr = rhs.ptr; // 复制U_Ptr指针
val = rhs.val; // 复制int成员
return *this;
而还要注意的是,重载赋值操作符的时候,一定要注意的是,检查自我赋值的情况。
如图所示:
此时,做p1 = p1的操作。那么,首先u1.use自增1,为2;然后,u1.use自减1,为1。那么就不会执行delete操作,剩下的操作都可以顺利进行。按《C++ primer》说法,“这个赋值操作符在减少左操作数的使用计数之前使rhs的使用计数加1,从而防止自身赋值”。哎,反正我是那样理解的。当然,赋值操作符函数中一来就可以按常规那样:
运行结果如下图:
代码如下:if(this == &rhs)
return *this;