STL 的string类怎么啦

STL 的string类怎么啦?陈皓

前言

上个周末在和我的同学爬香山闲聊时,同学说到STL中的string类曾经让他备受折磨,几年前他开发一个系统前对string类还比较清楚,然后随着程序的复杂度的加深,到了后期,他几乎对string类失去了信心和信任,他觉得他对string类一头雾水。老实说,我几年前也有同样的痛苦(就是当我写下《标准C++类string的Copy-On-Write技术》之前的一段时间)。那时,我不得不研究那根本不是给人看的SGI出品的string类的源码,代码的可读性几乎为零,而且随着了解越深入,就越觉得C++的世界中到处都是陷阱和缺陷。越来越觉得有时候那些类并不像自己所想象的那样工作。

为什么会发生这样的情况呢?string类只是一个“简单”的类,如果是一些比较复杂的类呢?而这几年来,C++阵营声讨标准模板库中的标准string类愈演愈烈。C++阵营对这个“小子”的争讨就没有停止过。相信在下一个C++的标准出台时,string类会有一个大的变化。

了解string类

在我们研究string类犯了什么毛病之前,还让我先说一下如何了解一个C++的类。我们要了解一个C++的类,一般来说,要从三个方面入手。

一、意图(Intention)。知其然还要知所以然,string类的意图是什么?只有了解了意图,才知道它的思路。这是了解一个事物最重要最根本的部分。不然,你会发现它的行为并不会像你所期望的那样。string类的意义有两个,第一个是为了处理char类型的数组,并封装了标准C中的一些字符串处理的函数。而当string类进入了C++标准后,它的第二个意义就是一个容器。这两件事并不矛盾,我们要需理解string的机制,需要从这两个方面考虑。

二、规格(Specification)。我们注意到string类有太多的接口函数。这是目前C++阵营中声讨其最重的话题。一个小小的string类居然有106个成员接口函数。居然,C++标准委员会会容忍这种“ugly”的事情的发生?目前的认为导致“C++标准委员会脑子进水”的主流原因有两点,一个是为了提高效率,另一个是为了常用的操作。

1)让我们先来看效率,看看string类中的“==”操作符重载接口:

bool operator==(const string& lhs, const string& rhs);
bool operator==(const string& lhs, const char* rhs);
bool operator==(const char* lhs, const string& rhs);

头一个很标准,而后两个似乎就显得没有必要了。如果我们调用:(Str == “string”)如果没有后面两个接口,string的构造函数会把char*的 ”string”转成string对象,然后再调用第一个接口,也就是 operator==(str, string(“string”))。如此“多余”的设计只能说是为了追求效率,为了省去调用构造/析构函数和分配/释放内存的时间(这会节省很多的时间)。在后面两个接口中,直接使用了C的strcmp函数。如此看来,这点设计还是很有必要的。string类中有很多为了追求效率的算法和设计,比如:Copy-on-Write(参看我的《标准C++类string的Copy-On-Write技术》)等。这些东西让我们的string变得很有效率,但也带来了陷阱。如果不知道这些东西,那么当你使用它的时候发生不可意料的问题,就会让你感到迷茫和不知所措。

2)另一个让string类拥有这么庞大的接口的原因是常用的操作。比如string类的substr(),这是一个截取子字符串的函数。其实这个函数并不需要,因为string有一个构造函数可以从别的string类中指定其起始和长度构造自己,从而实现这一功能。还有就是copy()函数,这也是一个没有必要的函数,copy这个函数把string类中的内容拷贝到一个内存buffer中,这个方法实践证明很少有人使用。可能,1)为了安全起见,需要有这样一个成员把内容复制出去;2)设计者觉得copy要比strcpy或是memcpy好写也漂亮很多吧。copy()比起substr()更没有必要存在。

三、实现(Implementation)。C++标准并没有过多的干预实现。不同的产商会有不同的实现。不同的产商会考虑标准中的一件事情是否符合市场的需要,并要考虑自己的编译器是否有能够编译标准的功能。于是,他们总是会轻微或是颠覆地修改着标准。C++在编译器的差异是令人痛苦和绝望的,如果不了解具体的实现,在你使用C++的时候,你也会发现它并不像你所想象的那样工作。

只有从上述三个方面入手,你才能真正了解一个C++类,而你也才能用好C++。C++高手们都是从这样的三个方面剖析着C++现实中的各种类,并以此来验证C++类的设计。

String类犯了什么错?

string类其实挺好的。它的设计很有技术含量。它有高的效率、运行速度快、容易使用。它有很充足的接口可以满足各式各样的法,使用起来也很灵活。

然而,这个string类似乎有点没有与时俱进,它现在的设计还保持着10年以前的样子,10年来,整个技术环境都出现很多变革,人们也在使用C++的过程中得到了许许多的经验。比如:现在的几乎所有的程序都运行在一个多进/线程的环境中,而10年前主流还只是单进/线程的应用,这是一个巨大的变化。近几年来,C++阵营也在实践中取得了很多的经验,特别是模板技术,而我们的STL显然没能跟上脚步。

首当其冲的是string类,目前C++阵营对string类的声讨主要集中在下面几个方面。对于下面的这些问题,C++阵营还是争论不休。不过,作为一个好的程序员,我们应该在我们的设计和编程中注意一下这些方面。

1)目前的标string类有106个接口函数(包括构造和析构函数),如果考虑上默认参数,那么就一共有134不同的接口。其中有5个函数模板还会产生无穷多个各种各样的函数。还有各种各样的性能上的优化。在这么从多的成员函数中,很多都是冗余不必要的。最糟糕的是,众多程序员们并不了解它们,导到要么浪费了它的优势,要么踩中了其中的陷阱。

2)很多人认为string类提供的功能中,该有的没有,已有的又很冗余。string类在同一个功能上实现了多次,而有一些功能却没有实现。如:大小写不区分的比较,宽行字符(w_char)的支持,和字符char型数据的接口等等。

3)作为一个STL的容器,string类和的设计和其它容器基本一样。这些STL都不鼓励被继承。因为STL容器的设计者们的几乎都遗忘了虚函数的使用,这样阻止了多态性,也许,这也是一个为了考虑效率和性能的设计。对于STL容易这样的设计,大多数人表示接受。但对于string类,很多人认为,string类是一个特殊的类,考虑到它被使用的频率,string类应该得到特殊的照顾。

4)还有很多人认为标准的strng类强行进行动态内存分配(malloc),那怕是一个很短的字符串。这会导致内存碎片问题(我们知道内存碎片问题会让malloc很长时间才能返回,由于降低了整个程序的性能。而关于内存碎片问题,这是一个很严重的问题,目前除了重启应用程序,还没有什么好的方法)。他们认为,string类的设计加剧了内存碎片问题。他们希望string类能够拥有自己的栈上内存来存放一些短字符串,而不需要总是去堆上分配内存。(因为用于string类的字符串长度几乎都不会很长)

5)很多string类的实现,都采用了Copy-On-Write(COW)技术。虽然这是一个很有效率的技术。但是因为内存的共享,导致了程序在“多线程”环境中及容易发生错误,如果分别在两个线程中的string实例共享着同一块内存,很有可能发生潜在的内存问题(参看我的《标准C++类string的Copy-On-Write技术》最后一节示例)。目前这一技术很有可能从下一版本的标准中移去。(而一些新版本的STL都不支持COW了,如Microsoft VC8.0下的STL)

6)标准的string类不支持policy-base技术的错误处理。string遇到错误时,只是简单地抛出异常。虽然这是一个标准,但有一些情况下不会使用异常(GCC –fno-exception)。另外,不可能要求所有的程序都要在使用string操作的时候try catch,一个比较好的方法是string类封装有自己的error-handling函数,并且可以让用户来定义需要使用哪一种错误处理机制。

由于string类的的种种不如人意,特别是106个接口函数让许多人难以接受,有很多人都在写适合自己的string类。但总体来说,标准的string类是一个好坏难辨的类。无论你是否是一个高级咨深的程序员,你都会用到它。它和整个C++一样,都是一把双刃剑,在大多数情况下,它还是值得我们信赖。

目前,对string类的争论有很多很多。C++标准委员会也说:“The C++ Standard is the best we could make it. If we could have agreed on how to make it better, then we would have made it better.”在C++这么一个混乱的领地,虽然STL并不完美,但对比起来说,他还是显得那么地漂亮和精致辞。

后记

又到了关于C++文章结束的时候,我还是要老调重弹。C++这个世界是很复杂很危险的。单单本文章中的一个小小的string类就能引起这么多的讨论,何况是别的类?

让我们大胆地怀疑一下, C++是否真是一种高级的语言?目前的C++需要使用他的人有相当的专业技术水平,而寄希望于人的高水平看来是和技术的发展背道而驰的。好的一门开发语言是让人可以容易方便地把更多的精力集中在业务逻辑性上。而C++这门语言却需要技术人员比以住的C有着更为高深和专业的技术知识和能力。

是我们对string的“无知”搞乱了我们的程序,还是string这个类的设计把我们的程序搞乱了?是C++自己把软件开发搞得一团混乱?还是使用C++的人把其搞得一团混乱?好像兼而有之,目前我们无法定论,但我们知道,无论是C++标准委员会,还是开发人员,大家的C++未来之路都还有很长。

(转载时请注明作者和出处。未经许可,请勿用于商业用途) 更多文章请访问我的Blog: http://blog.csdn.net/haoel

(0)

相关推荐

  • C++在成员函数中使用STL的find_if函数实例

    本文实例讲述了C++在成员函数中使用STL的find_if函数的方法.分享给大家供大家参考.具体方法分析如下: 一般来说,STL的find_if函数功能很强大,可以使用输入的函数替代等于操作符执行查找功能(这个网上有很多资料,我这里就不多说了). 比如查找一个数组中的奇数,可以用如下代码完成(具体参考这里:http://www.cplusplus.com/reference/algorithm/find_if/): #include <iostream> #include <algori

  • STL区间成员函数及区间算法总结

    在这里总结下可替代循环的区间成员函数和区间算法: 相比单元素遍历操作,使用区间成员函数的优势在于: 1)更少的函数调用 2)更少的元素移动 3)更少的内存分配 在区间成员函数不适用的情况下也应该使用区间算法,至少,相比手写循环而言,它更加简单,有效,并且不容易出错: 区间成员函数 区间构造 标准容器都支持区间构造函数: 复制代码 代码如下: container::container(InputIterator begin, // 区间的起点                   InputIter

  • c++非变易算法-stl算法

    C++ STL标准模板库在数据结构和算法的实践领域发挥着重要作用,极大的提高了开发效率.STL的三大组成部分为容器.迭代器.算法,本文主要讲解STL算法中的非变易算法.本文从实践的角度简单介绍了一下相关函数的使用. C++ STL的非变易算法(Non-mutating algorithms)是一组不破坏函数数据的模板函数,用来对序列数据进行逐个处理.元素查找.子序列搜索.统计和匹配,基本上可用于各种容器.下面的叙述中迭代器区间默认为[first, last),迭代器具有"++"迭代和&

  • jsp 使用jstl实现翻页实例代码

    使用jstl进行显示相对使用jsp来说代码更显得整齐,也使代码量显得较少 复制代码 代码如下: <%@page language="java" contentType="text/html; charset=UTF-8" pageEncoding="UTF-8"%><%@taglib prefix="c"  uri = "http://java.sun.com/jsp/jstl/core"

  • stl常用算法(Algorithms)介绍(stl排序算法、非变序型队列)

    算法:用来处理群集内的元素.它们可以出于不同的目的而搜寻,排序,修改,使用那些元素.是一种应用在容器上以各种方法处理其内存的行为或功能,如sort(排序),copy(拷贝)- 算法由模板函数体现,这些函数不是容器类的成员函数,是独立的函数,它们可以用于STL容器,也可以用于普通的C++数组等. 头文件:#include<algorithm> 在STL的泛型算法中有4类基本的算法: 1)变序型队列算法: 可以改变容器内的数据: 2)非变序型队列算法:处理容器内的数据而不改变他们: 3)排序值算法

  • C++ STL容器stack和queue详解

    stack是一个比较简单的容器,它的使用也很简单,stack是LIFO容器,就是后进先出,最后添加进去的元素,第一个取出来 stack初始化 std::stack<int> first; std::stack<int> second(first); std::stack<int, std;:vector<int>> third; //使用vector初始化stack ### stack常用方法### empty();//判断是否为空 push(Elem e)

  • C++语言 STL容器list总结

    在使用std::list<>链表时,难免会对数据进行添加删除操作.而遍历链表则有两种方式:通过索引访问,象数组一样处理:通过std::list<>::iterator链表遍历器进行访问 STL 中的list 就是一 双向链表,可高效地进行插入删除元素. list不支持随机访问.所以没有 at(pos)和operator[]. list 对象list1, list2 分别有元素list1(1,2,3),list2(4,5,6) .list< int>::iterator

  • stl容器set,map,vector之erase用法与返回值详细解析

    总结本人在工作中经验教训. 在使用 list.set 或 map遍历删除某些元素时可以这样使用: 正确使用方法1 复制代码 代码如下: std::list< int> List;      std::list< int>::iterator itList;      for( itList = List.begin(); itList != List.end(); )      {            if( WillDelete( *itList) )            {

  • c++ STL容器总结之:vertor与list的应用

    STL提供六大组件,彼此可以组合套用 1.容器(containers):各种数据结构,如vertor,list,deque,set,map.从实现的角度来看,STL容器是一种class template 2.算法(algorithms):各种算法如sort,search,copy,earse.STL算法是一种 function template. 3.迭代器(iterators):扮演容器与算法之间的胶合剂,是所谓的"泛型指针".所有STL容器都有自己的专属的迭代器. 4.仿函数(fu

  • STL 的string类怎么啦

    STL 的string类怎么啦?陈皓 前言 上个周末在和我的同学爬香山闲聊时,同学说到STL中的string类曾经让他备受折磨,几年前他开发一个系统前对string类还比较清楚,然后随着程序的复杂度的加深,到了后期,他几乎对string类失去了信心和信任,他觉得他对string类一头雾水.老实说,我几年前也有同样的痛苦(就是当我写下<标准C++类string的Copy-On-Write技术>之前的一段时间).那时,我不得不研究那根本不是给人看的SGI出品的string类的源码,代码的可读性几乎

  • C++STL之string类的使用

    目录 1.STL简介 (1)什么是STL (2)STL的版本 (3)如何学习STL (4)STL的六大组件 2.string类的基本概念 (1)含义 (2)使用方法 (3)原理 3.string类中常见构造函数 4.string类中析构函数 5.string类对象的容量操作 (1)显示容量 (2)扩容 6.string类中operator[]重载 (1)举例 (2)底层实现 7.string类与迭代器 (1)举例 (2)反向迭代器 (3)使用迭代的意义 (4)补充:语法糖实现遍历 8.strin

  • 分享C++面试中string类的一种正确写法

    具体来说: 能像 int 类型那样定义变量,并且支持赋值.复制. 能用作函数的参数类型及返回类型. 能用作标准库容器的元素类型,即 vector/list/deque 的 value_type.(用作 std::map 的 key_type 是更进一步的要求,本文从略). 换言之,你的 String 能让以下代码编译运行通过,并且没有内存方面的错误. 复制代码 代码如下: void foo(String x)  {  } void bar(const String& x)  {  } Strin

  • 关于C++STL string类的介绍及模拟实现

    目录 一.标准库中的string类 1.string类 2.string类中的常用接口说明+模拟实现 2.1 string类对象的常见构造+模拟实现 2.2 string类对象的容量操作+模拟实现 2.3 string类对象的访问及遍历操作+模拟实现 2.4 string类对象的修改操作+模拟实现 2.5 string类非成员函数+模拟实现 一.标准库中的string类 1.string类 字符串的表示字符序列的类 标准的字符串类提供了对此类对象的支持,其接口类似于标准字符容器的接口,但添加了专

  • 一起来看看C++STL容器之string类

    目录 前言 1.标准库中的string类 2.string类的常用接口说明 2.1string对象的常见构造 2.2string类对象的容量操作 2.2.1reserve是如何开辟空间的 2.2.2clear和empty 2.2.3resize的用法 2.3string类对象的访问以及遍历操作 范围for的使用 2.4string类对象的修改操作 2.4.1push_back和append以及operator+= 2.4.2 find和rfind以及substr 2.5string非成员函数重载

  • 探究C++中string类的实现原理以及扩展使用

    C++程序员编码过程中经常会使用string(wstring)类,你是否思考过它的内部实现细节.比如这个类的迭代器是如何实现的?对象占多少字节的内存空间?内部有没有虚函数?内存是如何分配的?构造和析构的成本有多大?笔者综合这两天阅读的源代码及个人理解简要介绍之,错误的地方望读者指出. 首先看看string和wstring类的定义: typedef basic_string<char, char_traits<char>, allocator<char> > string

  • 代码分析c++中string类

    一:回顾 (1)c++中的string类是在面试中和笔试中经常考的题目: 工程代码免费下载 string类的自行实现 (2)c++中的string类和fstream类合起来是处理外部数据的利器: (3)string类经常用到find find_first_of find_first_not_of find_last_of find_last_not_of substr replace等,以及联合使用来达到java中的split和trim (4) 使用friend 仅仅是在类中进行声明的非内部 却

  • C++中的string类(C++字符串)入门完全攻略

    前言 string 类是 STL 中 basic_string 模板实例化得到的模板类.其定义如下: typedef basic_string <char> string; basic_string 此处可以不必深究. string 类的成员函数有很多,同一个名字的函数也常会有五六个重载的版本.篇幅所限,不能将这些原型一一列出并加以解释.这里仅对常用成员函数按功能进行分类,并直接给出应用的例子,通过例子,读者可以基本掌握这些成员函数的用法. 要想更深入地了解 string 类,还要阅读 C++

  • C++ STL之string的模拟实现实例代码

    目录 前言 构造函数 析构函数 拷贝构造函数 operator=赋值运算符重载 c_str operator[] size() capacity() empty() operator+= 扩容函数(reserve) resize() push_back() append() insert() erase() find() 1.查找一个字符 2.查找一个字符串 substr() 比较大小函数 总结 前言 上一章我们对string的常见接口及使用进行了讲解,接下来我们将对一些常见的接口,包括构造函数

  • C++中的string类的用法小结

    相信使用过MFC编程的朋友对CString这个类的印象应该非常深刻吧?的确,MFC中的CString类使用起来真的非常的方便好用.但是如果离开了MFC框架,还有没有这样使用起来非常方便的类呢?答案是肯定的.也许有人会说,即使不用MFC框架,也可以想办法使用MFC中的API,具体的操作方法在本文最后给出操作方法.其实,可能很多人很可能会忽略掉标准C++中string类的使用.标准C++中提供的string类得功能也是非常强大的,一般都能满足我们开发项目时使用.现将具体用法的一部分罗列如下,只起一个

随机推荐