operator new在C++中的各种写法总结

乍一看,在C++中动态分配内存很简单:new是分配,delete是释放,就这么简单。然而,这篇文章讲得要复杂一点,并且要考虑到自定义层次。这也许对简单的程序并不重要,但对你在代码中控制内存却是十分必要的,是否能写一个自定义的分配器,某种高级内存管理表或一个特定的垃圾回收机制。

这篇文章并不是一个综合的手册,而是一个C++中各种内存分配方法的概述。它面向已经很熟悉C++语言的读者。

原生operator new

我们先从原生operator new开始。考虑如下代码,它用来分配5个int型的空间并返回指向他们的指针[1]:

int* v = static_cast<int*>(::operator new(5 * sizeof(*v)));

当像如上的调用,operator new扮演原生的内存分配角色,类似malloc。上面等价于:

int* v = static_cast<int*>(malloc(5 * sizeof(*v)));

释放用operator new分配的内存用operator delete:

::operator delete(v);

你愿意永远用原生new和delete函数吗?是,只在极少数不用,我在下面的文章中会论证的。为什么用它们而不用原来的可信的malloc和free呢?一个很充分的原因就是你想保持代码在C++领域的完整性。混合使用new和free(或malloc和delete)是很不可取的(big NO NO)。用new和delete的另一个原因是你可以重载(overload)或重写(override)这些函数,只要你需要。下面是个例子:


代码如下:

void* operator new(size_t sz) throw (std::bad_alloc)
{
    cerr << "allocating " << sz << " bytesn";
    void* mem = malloc(sz);
    if (mem)
        return mem;
    else
        throw std::bad_alloc();
}

void operator delete(void* ptr) throw()
{
    cerr << "deallocating at " << ptr << endl;
    free(ptr);
}

通常,注意到new被用来给内置类型,不包含用户自定义new函数的类的对象,和任意类型的数组分配空间,使用的都是全局的运算符new。当new被用来为已经被重定义new的类实例化时,用的就是那个类的new函数。

下面来看下带new函数的类。

特定类的operator new
大家有时很好奇"operator new"和"new operator"的区别。前者可以是一个重载的operator new,全局的或者特定类或者原生的operator new。后者是你经常用来分配内存的C++内置的new operator,就像:

Car* mycar = new Car;

C++支持操作符重载,并且我们可以重载的其中一个就是new。

下面是个例子:


代码如下:

class Base
{
public:
    void* operator new(size_t sz)
    {
        cerr << "new " << sz << " bytesn";
        return ::operator new(sz);
    }

void operator delete(void* p)
    {
        cerr << "deleten";
        ::operator delete(p);
    }
private:
    int m_data;
};

class Derived : public Base
{
private:
    int m_derived_data;
    vector<int> z, y, x, w;
};

int main()
{
    Base* b = new Base;
    delete b;

Derived* d = new Derived;
    delete d;
    return 0;
}

打印结果:
new 4 bytes
delete
new 56 bytes
delete

在基类被重载的operator new和operator delete也同样被子类继承。如你所见,operator new得到了两个类的正确大小。注意实际分配内存时使用了::operator new,这是前面所描述过的原生new。在调用前面的两个冒号很关键,是为了避免进行无限递归(没有它函数将一直调用自己下去)。

为什么你要为一个类重载operator new?这里有许多理由。

性能:默认的内存分配算符被设计成通用的。有时你想分配给一个非常特殊的对象,通过自定义分配方式可以明显地提高内存管理。许多书和文章都讨论了这种情况。尤其是"Modern C++ Design"的第4章展示了一个为较小的对象的非常好的设计并实现了自定义的分配算符。

调试 & 统计:完全掌握内存的分配和释放为调试提供了很好的灵活性,统计信息和性能分析。你可将你的分配算符插入进专门用来探测缓冲区溢出的守卫,通过分配算符和释放算符(deallocations)的比较来检测内存泄漏,为统计和性能分析积累各种指标,等等。

个性化:对于非标准的内存分配方式。一个很好的例子是内存池或arenas,它们都使得内存管理变得更简单。另一个例子是某个对象的完善的垃圾回收系统,可以通过为一个类或整个层面写你自己的operators new和delete。

研究在C++中new运算符是很有帮助的。分配是分两步进行:

1.  首先,用全局operator new指导系统请求原生内存。
2.  一旦请求内存被分配,一个新的对象就在其中开始构造。

The C++ FAQ给出一个很好的例子,我很愿意在这里这出来:

当你写下这段代码:

Foo* p = new Foo();

编译器会生成类似这种功能的代码:


代码如下:

Foo* p;

// don't catch exceptions thrown by the allocator itself

//不用捕捉分配器自己抛出的异常

void* raw = operator new(sizeof(Foo));

// catch any exceptions thrown by the ctor

//捕捉ctor抛出的任何异常

try {
   p = new(raw) Foo();  // call the ctor with raw as this 像这样用raw调用ctor分配内存
 }
 catch (...) {
   // oops, ctor threw an exception 啊哦,ctor抛出了异常
   operator delete(raw);
   throw;  // rethrow the ctor's exception 重新抛出ctor的异常
 }

其中在try中很有趣的一段语法被称为"placement new",我们马上就会讨论到。为了使讨论完整,我们来看下用delete来释放一个对象时一个相似的情况,它也是分两步进行:

1.首先,将要被删除对象的析构函数被调用。
2.然后,被对象占用的内存通过全局operator delete函数返还给系统。

所以:
delete p;
等价于[2]:
if (p != NULL) {
  p->~Foo();
  operator delete(p);
}

这时正适合我重复这篇文章第一段提到的,如果一个类有它自己的operator new或 operator delete,这些函数将被调用,而不是调用全局的函数来分配和收回内存。

Placement new
现在,回来我们上面看到样例代码中的"placement new"问题。它恰好真的能用在C++代码中的语法。首先,我想简单地解释它如何工作。然后,我们将看到它在什么时候有用。

直接调用 placement new会跳过对象分配的第一步。也就是说我们不会向操作系统请求内存。而是告诉它有一块内存用来构造对象[3]。下面的代码表明了这点:


代码如下:

int main(int argc, const char* argv[])
{
    // A "normal" allocation. Asks the OS for memory, so we
    // don't actually know where this ends up pointing.
    //一个正常的分配。向操作系统请求内存,所以我们并不知道它指向哪里
    int* iptr = new int;
    cerr << "Addr of iptr = " << iptr << endl;

// Create a buffer large enough to hold an integer, and
    // note its address.
    //创建一块足够大的缓冲区来保存一个整型,请注意它的地址
    char mem[sizeof(int)];
    cerr << "Addr of mem = " << (void*) mem << endl;

// Construct the new integer inside the buffer 'mem'.
    // The address is going to be mem's.
    //在缓冲区mem中构造新的整型,地址将变成mem的地址
    int* iptr2 = new (mem) int;
    cerr << "Addr of iptr2 = " << iptr2 << endl;

return 0;
}

在我的机器上输出如下:

Addr of iptr = 0x8679008
Addr of mem = 0xbfdd73d8
Addr of iptr2 = 0xbfdd73d8

如你所见,placement new的结构很简单。而有趣的问题是,为什么我需要用这种东西?以下显示了placement new在一些场景确实很有用:

· 自定义非侵入式内存管理。当为一个类重载 operator new 同时也允许自定义内存管理,这里关键概念是非侵入式。重载一个类的 operator new需要你改变一个类的源代码。但假设我们有一个类的代码不想或者不能更改。我们如何仍能控制它的分配呢? Placement new就是答案。这种用 Placement new达到这个目的的通用编程技术叫做内存池,有时候也叫arenas[4]。

· 在一些程序中,在指定内存区域的分配对象是很必要的。一个例子是共享内存。另一个例子是嵌入式程序或使用内存映射的周边驱动程序,这些都可以很方便地在它们的“领地”分配对象。

· 许多容器库预先分配很大一块内存空间。当一个对象被添加,它们就必须在这里构造,因此就用上了placement new。典型的例子就是标准vector容器。

删除用placement new 分配的对象

一条C++箴言就是一个用new创建的对象应该用delete来释放。这个对placement new 同样适用吗?不完全是:


代码如下:

int main(int argc, const char* argv[])
{
    char mem[sizeof(int)];
    int* iptr2 = new (mem) int;

delete iptr2;       // Whoops, segmentation fault! 呜啊,段错误啦!

return 0;
}

为了理解上面代码片段为什么delete iptr2会引起段错误(或某种内存异常,这个因操作系统而异),让我们回想下delete iptr2实际干了什么:

1.  First, the destructor of the object that's being deleted is called.

首先,调用将要被删除的对象的析构函数。

2.  Then, the memory occupied by the object is returned to the OS, represented by the global operator delete function.

然后,这个对象在操作系统中占用的内存用全局operator delete函数收回。

对于用placement new分配的对象,第一步是没有问题的,但第二步就可疑了。尝试释放一段没有被分配算符实际分配的内存就不对了,但上面的代码确实这么做了。iptr2指向了一段并没有用全局operator new分配的栈中的一段位置。然而,delete iptr2将尝试用全局operator delete来释放内存。当然会段错误啦。

那么我们应该怎么办?我们应该怎样正确地删除iptr2?当然,我们肯定不会认为编译器怎么会解决怎么翻译内存,毕竟,我们只是传了一个指针给placement new,那个指针可能是从栈里拿,从内存池里或者别的地方。所以必须手动根据实际情况来释放。

事实上,上面的placement new用法只是C++的new指定额外参数的广义placement new语法的一种特例。它在标准头文件中定义如下:


代码如下:

inline void* operator new(std::size_t, void* __p) throw()
{
    return __p;
}

C++一个对应的带有相同参数的delete也被找到,它用来释放一个对象。它在头文件中定义如下:


代码如下:

inline void  operator delete  (void*, void*) throw()
{
}

的确,C++运行并不知道怎么释放一个对象,所以delete函数没有操作。

怎么析构呢?对于一个int,并不真的需要一个析构函数,但假设代码是这样的:
char mem[sizeof(Foo)];
Foo* fooptr = new (mem) Foo;

对于某个有意义的类Foo。我们一旦不需要fooptr了,应该怎么析构它呢?我们必须显式调用它的析构函数:
fooptr->~Foo();
对,显式调用析构函数在C++中是合法的,并且这也是唯一一种正确的做法[5]。

结论
这是一个复杂的主题,并且这篇文章只起到一个介绍的作用,对C++的多种内存分配方法给出了一种“尝鲜”。一旦你研究一些细节会发现还有许多有趣的编程技巧(例如,实现一个内存池分配)。这些问题最好是在有上下文的情况下提出,而不是作为一个普通的介绍性文章的一部分。如果你想知道得更多,请查阅下面的资源列表。

资源
· C++ FAQ Lite, especially items 11.14 and 16.9

·  "The C++ Programming Language, 3rd edition" by Bjarne Stroustrup – 10.4.11

· "Effective C++, 3rd edition" by Scott Myers – item 52

·  "Modern C++ Design" by Andrei Alexandrescu – chapter 4

· Several StackOverflow discussions. Start with this one and browse as long as your patience lasts.


















我仍会在operator new前面显式地写::(双冒号),虽然这里并不是必须的。恕我直言,这是一个很好的做法,特别当在重载operator new的类中,可以避免二义性。

[2]

注意到这里是检查是否为NULL。这样做使delete p 很安全,即使p是NULL。

[3]

对传给placement new的指针确保有足够的内存分配给对象,并且确保它们正确地对齐,这都是你的应该做的。

[4]

内存池本身是一个很大且迷人的话题。我并不打算在这里扩展,所以我鼓励你自己上网找些信息,WIKI如往常一样是个好地方(good start)。

[5]

事实上,标准的vector容器用这种方法去析构它保存的数据。

(0)

相关推荐

  • C++中Operator类型强制转换成员函数解析

    类型转换操作符(type conversion operator)是一种特殊的类成员函数,它定义将类类型值转变为其他类型值的转换.转换操作符在类定义体内声明,在保留字 operator 之后跟着转换的目标类型.转换函数又称类型强制转换成员函数,它是类中的一个非静态成员函数.它的定义格式如下: 复制代码 代码如下: class <类型说明符1> { public: operator <类型说明符2>(); - } 这个转换函数定义了由<类型说明符1>到<类型说明符2

  • 指向类成员函数的指针其实并非指针

    1.与常规指针不同,一个指向成员的指针并不指向一个具体的内存位置,它指向的是一个类的特定成员,而不是指向特定对象里的特定成员.通常最清晰的做法,是将指向数据成员的指针看作为一个偏移量. 这个偏移量告诉你,一个特定成员的位置距离对象的起点有多少个字节. 2.给定一个成员在类内的偏移量,为了访问位于那个偏移量的数据成员,我们需要该类的一个对象的地址.这时候就需要 .*和->*的操作.pC->*pimC,请求将pC内的地址加上pimC内的偏移量,为的是访问pC所指向的C对象中适当的数据成员.aC.*

  • C++运算符重载 成员函数与友元函数详解

    复制代码 代码如下: #include<iostream>using namespace std;class A{    int x,y;    public:    A(int xx,int yy):x(xx),y(yy){}    A(){x=0;y=0;}    A operator+(const A&b) //不加const限定,也可以    { return A(x+b.x,y+b.y); }    A operator-()    { return A(-x,-y); } 

  • 全面解析C++中的new,operator new与placement new

    new operator/delete operator就是new和delete操作符,而operator new/operator delete是函数. new operator(1)调用operator new分配足够的空间,并调用相关对象的构造函数(2)不可以被重载 operator new(1)只分配所要求的空间,不调用相关对象的构造函数.当无法满足所要求分配的空间时,则        ->如果有new_handler,则调用new_handler,否则        ->如果没要求不

  • C++指向类成员函数的指针详细解析

    首先 函数指针是指向一组同类型的函数的指针:而类成员函数我们也可以相似的认为,它是指向同类中同一组类型的成员函数的指针,当然这里的成员函数更准确的讲应该是指非静态的成员函数.前者是直接指向函数地址的,而后者我们从字面上也可以知道 它肯定是跟类和对象有着关系的. 函数指针实例: 复制代码 代码如下: typedef int (*p)(int,int);//定义一个接受两个int型且返回int型变量的函数指针类型int func(int x,int y){ printf("func:x=%d,y=%

  • operator new在C++中的各种写法总结

    乍一看,在C++中动态分配内存很简单:new是分配,delete是释放,就这么简单.然而,这篇文章讲得要复杂一点,并且要考虑到自定义层次.这也许对简单的程序并不重要,但对你在代码中控制内存却是十分必要的,是否能写一个自定义的分配器,某种高级内存管理表或一个特定的垃圾回收机制. 这篇文章并不是一个综合的手册,而是一个C++中各种内存分配方法的概述.它面向已经很熟悉C++语言的读者. 原生operator new 我们先从原生operator new开始.考虑如下代码,它用来分配5个int型的空间并

  • JavaScript中闭包的写法和作用详解

    1.什么是闭包 闭包是有权访问另一个函数作用域的变量的函数. 简单的说,Javascript允许使用内部函数---即函数定义和函数表达式位于另一个函数的函数体内.而且,这些内部函数可以访问它们所在的外部函数中声明的所有局部变量.参数和声明的其他内部函数.当其中一个这样的内部函数在包含它们的外部函数之外被调用时,就会形成闭包. 2.变量的作用域 要理解闭包,首先要理解变量的作用域. 变量的作用域无非就是两种:全局变量和局部变量. Javascript语言的特殊之处,就在于函数内部可以直接读取全局变

  • 详解Java中clone的写法

    Cloneable这个接口设计得十分奇葩,不符合正常人的使用习惯,然而用这个接口的人很多也很有必要,所以还是有必要了解一下这套扭曲的机制.以下内容来自于对Effective Java ed 2. item 11的整理.  Cloneable接口 首先,Cloneable接口中并没有方法.它的存在意义一是让程序员注明当前对象可以clone,二是改变父类Object类中clone方法的行为:如果某个类实现了Cloneable,那么它的父类Object的clone方法可以调用,否则会抛出CloneNo

  • javascript中函数的写法实例代码详解

    具体代码如下所述: <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <meta name="viewport" content="width=device-width, initial-scale=1.0"> <meta http-equiv="X-UA-Compatible

  • TypeScript中函数重载写法

    目录 1. 函数签名 2.函数重载 2.1 重载签名是可调用的 2.1 实现签名必须是通用的 3.方法重载 4. 何时使用函数重载 5.总结 前言: 大多数函数接受一组固定的参数.但有些函数可以接受可变数量的参数,不同类型的参数,甚至可以根据你调用函数的方式返回不同的类型.为了注释这样的函数,TypeScript 提供了函数重载功能. 1. 函数签名 我们先来考虑一个函数,它返回给一个特定的人的问候信息. function greet(person: string): string { retu

  • 详解spring mvc中url-pattern的写法

    1.设置url-pattern为*.do(最为常见的方式) 只要你的请求url中包含配置的url-pattern,该url就可以到达DispatcherServlet.当然这里业内通常都将url-pattern配置为*.do的方式,所以你最好也这么去做. 2.设置url-pattern为/*(这种方式是很不好) 如果将url-pattern设置为/*之后,web项目中的jsp都不能访问了会报出404的错误,这是因为DispatcherServlet会将向JSP页面的跳转请求也当作是一个普通的 C

  • Python3中常见配置文件写法汇总

    目录 1.引言 2.配置文件写法 2.1 ini 2.2 json 2.3 toml 2.4 yaml 3.总结 1.引言 小鱼:小屌丝,走啊,出去撸串啊, 小屌丝:没时间啊,鱼哥 小鱼:嗯??? 啥事情让你忙的撸串都不去了 小屌丝:我的BOSS让我写一个自动化平台,但是我不知道这些参数放在**.py文件里面,还是放在配置文件**里面. 小鱼:就因为这个? 小屌丝:对啊, 小鱼:唉…我还以为啥事呢, 放在配置文件里. 小屌丝:但是,我对配置文件写法不太熟(尴尬的一批)… 小鱼:… 每次都上当,

  • 超强推荐的js编程中的简洁写法收集

    举个例子,比如数据a,一般访问每个数据会用 for(var x=0;x<a.length;x++) {      alert(a[x]) } 简洁的写法是 for(var x in a) {      alert(a[x]) } 新建数组的简单写法 d=[1,2,3,3,4,3,2,2] 或 d={1,2,3,3,4,3,2,2} 如果字符串,用 d="asfwf,asdf,w,x,,a,sfw,,x,asfw,".split(",") 更简单取字符串c第二个

  • SQL Server中参数化SQL写法遇到parameter sniff ,导致不合理执行计划重用的快速解决方法

    parameter sniff问题是重用其他参数生成的执行计划,导致当前参数采用该执行计划非最优化的现象.想必熟悉数据的同学都应该知道,产生parameter sniff最典型的问题就是使用了参数化的SQL(或者存储过程中使用了参数化)写法,如果存在数据分布不均匀的情况下,正常情况下生成的执行计划,在传入在分布数据较多的参数的情况下,重用了正常参数生成的执行计划,而这种缓存的执行计划并非适合当前参数的一种情况. 这种情况,在实际业务中,出现的频率还是比较高的,因为存储过程一般都是采用参数化的写法

  • C++ 中strcpy标准写法实例详解

    strcpy标准写法 实例代码: // CppReference.cpp : 定义控制台应用程序的入口点. // #include "stdafx.h" using namespace std; /* * 说明:字符串拷贝版本1 * 参数:dest目标地址,src源地址 * 返回:返回拷贝好的地址:如果出错或者有重叠,无定义 * 异常:可能出现字符串溢出,及dest所占空间不如src所占空间大. */ char *strcpy_v1(char *dest , const char *s

随机推荐