C++ STL之string的模拟实现实例代码

2025-01-28 23:53:05

前言

上一章我们对string的常见接口及使用进行了讲解，接下来我们将对一些常见的接口，包括构造函数，析构函数，运算符重载等等进行模拟实现.方便我们理解string接口实现的原理.

在讲解之前先说一下string的成员变量.

首先是字符串内容_str，再是字符串的大小_size,最后是字符串的总容量大小_capacity.

class string
	{
	private:
		char* _str;
		size_t _size;
		size_t _capacity;
	};

构造函数

缺省值是一个空串，再给_str开辟空间时要多开辟一个空间存储'\0'

开好了空间最后需要把内容拷贝到_str.

		string(const char* str = "")
		{
			//这里有个细节，就是先计算出_size大小，然后再直接把_size赋值给_capacity,省了一次strlen()的调用.
			_size = strlen(str);
			_capacity = _size;
			_str = new char[_capacity + 1];
			strcpy(_str, str);
		}

析构函数

完成对string类成员的资源清理，空间释放等一些操作.

        ~string()
		{
            //释放_str的空间，并将其指向的空间置为空
			delete[] _str;
			_str = nullptr;

			_size = _capacity = 0;
		}

拷贝构造函数

说到string的拷贝构造函数，这里一定会涉及到深浅拷贝问题.

所以在讲解它的拷贝构造函数之前必须先了解它

浅拷贝：也称位拷贝，编译器只是将对象中的值拷贝过来。如果对象中管理资源，可能就会导致多个对象共享同一份资源，当一个对象销毁时就会将该资源释放掉，但是其他的对象不知道该资源已经被释放了，以为资源还有效，所以他们会继续对这个资源进行访问。这时就出现了违法访问。深拷贝就是为了解决浅拷贝的问题。

深拷贝：就是给自己重新开辟一块空间，并将数据拷贝到新开辟的空间中，如果一个类中涉及到资源的管理，其拷贝的构造函数，赋值运算符重载以及析构函数必须要显式给出。（就是要手动写，不能用编译器自动生成的）。一般这种情况都是按照深拷贝方式提供。

所以拷贝的时候，需要重新给_str开辟一块空间.

		string(const string& s)
			:_str(new char[s._capacity + 1])
			, _size(s._size)
			, _capacity(s._capacity)
		{
			strcpy(_str, s._str);
		}

这里也用图浅浅的介绍一下浅拷贝和深拷贝的区别.

operator=赋值运算符重载

正如上一个所说，=赋值运算符也同样存在深浅拷贝的问题，所以也必须进行深拷贝.

它和拷贝构造的主要区别就是：拷贝构造是对象还没有初始化时进行拷贝，而赋值运算符重载是对一个已经存在的变量进行赋值.

当然同样这里也需要深拷贝

也有一些需要注意的问题：例如s1=s2.我们把s2赋值给s1后，那么原本的s1空间该怎么办呢？

我们的解决方案是：

把原本的s1空间释放掉，然后再开辟一块和s2大小相同的空间，再把内容从s2拷贝到s1

		//= 运算符重载
		string& operator=(const string& s)
		{
			//不能自己赋值给自己
			if (this != &s)
			{//先释放掉原本的空间
				delete[] _str;
				_str = new char[s._capacity + 1];
				strcpy(_str, s._str);
				_size = s._size;
				_capacity = s._capacity;
			}
			return *this;
		}

c_str

c_str就是返回c语言风格的字符串，既返回char*类型字符串，返回字符串首地址即可.

	const char* c_str() const
	{
		return _str;
	}

为什么加const呢？

第一个const是为了使普通对象和const对象都可以调用这个函数，因为权限只可以缩小，不可以放大.

第二个const是保证函数体内的内容不会被改变，既this指针指向的内容无法被改变.

operator[]

实现[]重载，是指传过来一个下标index，返回它index下标所对应的值

目的是让字符串可以像数组一样访问每一个元素.

		char& operator[](size_t index)
		{
            //下标必须小于字符串总大小
			assert(index < _size);

			return _str[index];

		}

当然为了const对象也可以调用，我们可以再写一个const修饰的operator[].

		const char& operator[](size_t index) const
		{
			assert(index < _size);

			return _str[index];
		}

size()

写一个函数，直接返回_size即可

        size_t size() const
		{
			return _size;
		}

那可能会有人想问了：既然返回_size,那我们直接调用它这个成员不就行了，为什么还有套一层函数呢？

这是因为_size是被private修饰的，我们是不能直接访问私有成员的.

所以需要实现一个公有的函数间接访问_size.

capacity()

这个所注意的和size完全一致.

		size_t capacity() const
		{
			return _capacity;
		}

empty()

只需要判断当前的size是否等于0即可.

		bool empty() const
		{
			return _size == 0;
		}

operator+=

这个重载运算符我们上一章讲过是可以插入字符或者插入字符串的，这里也分别复用了push_back和append(),这两个函数后面将模拟实现.

		string& operator+= (const char ch)
		{
			push_back(ch);

			return *this;
		}

		string& operator+= (const char* str)
		{
			append(str);

			return *this;
		}

扩容函数(reserve)

调整容量大小到n

先new一个n+1的新空间，再把原来的数据拷贝到新空间中去，然后释放掉原来的空间，然后将capacity设置为n.

void reserve(size_t n)
		{
			//n应该大于之前的容量
			if (n > _capacity)
			{
				//先开辟大小为n+1的空间
				char* tmp = new char[n + 1];
				//将原来的数据拷贝到tmp
				strcpy(tmp, _str);
				//释放掉原来的数据
				delete[] _str;

				//将扩容后的数据重新赋给_str
				_str = tmp;
				_capacity = n;
			}
		}

画图来理解一下它

resize()

resize会有以下两种情况：

1.若n < _size,既重新调整后的大小小于原来的大小，会发生数据截断，只保留前n个字符.

2.若n > _size,这里直接复用reserve即可

既如果n<_capacity,此时_capacity不发生变化，多出的空间用ch替代.

如果n>_capacity,此时_capacity需要扩容(1.5倍速度，不一定是n),直到最接近为止.

		void resize(size_t n, char ch = '\0')
		{
			if (n > _size)
			{
				//插入数据
                //reserve会和容量进行比较以及是否需要阔人
				reserve(n);
                //多余的字符用ch替代
				for (size_t i = _size; i < n; i++)
				{
					_str[i] = ch;
				}
                //字符串结束
				_str[n] = '\0';
				_size = n;
			}
			else
			{
				//删除数据
                 //直接将第n个数据改为'\0'，这样相当于将后面的数据全部删除了.
				_str[n] = '\0';
				_size = n;
			}
		}

push_back()

push_back的作用是在原字符串后上拼接一个字符，首先我们现需要判断空间是否足够，如不够，则需要扩容，复用之前的reserve函数，再进行插入数据，最后加上'\0'.

当然还可以利用复用insert()函数进行插入，这个后面再实现.

		void push_back(char ch)
		{
			if (_size == _capacity)
			{
				reserve(_capacity == 0 ? 4 : _capacity * 2);
				_str[_size] = ch;
				++_size;
				_str[_size] = '/0';
			}
		}

还以复用insert这样插入，会使代码健壮性更强，更加简洁.

这个inser()函数后面会实现.

			insert(_size, ch);

append()

这个与push_back不同的是：push_back()只能插入一个字符，append()只可以插入一个字符串.

这里的问题就出现了，我们不知道追加的字符串长度，自然扩容的时候也不知道扩大到多少，是2倍还是3倍，所以这里要看插入的字符串的长度len，只要要让空间开到_size+len.

让空间满足最低的情况，能把所有的字符容纳下，最后利用strcpy将其数据拷贝过来即可.

        	void append(const char* str)
		    {
				size_t len = strlen(str);
				if (_size + len > _capacity)
				{
					reserve(_size + len);
				}
				strcpy(_str + _size, str);
				_size = _size + len;
			}

当然同样可以复用insert函数.

    insert(_size, str);

下面就该说insert函数了.

insert()

insert也分为两种情况：插入一个字符或插入多个字符(字符串)

插入一个字符：方法类似于顺序表的插入

		string& insert(size_t pos, char ch)
		{
            //插入的位置必须要与字符串大小
			assert(pos <= _size);
            //如果空间满了，则需要扩容
			if (_size == _capacity)
			{
				reserve(_capacity == 0 ? 4 : _capacity * 2);
			}
            //插入操作
			size_t end = _size + 1;
			while (end > pos)
			{
				_str[end] = _str[end - 1];
				--end;
			}
			_str[pos] = ch;
			++_size;
			return *this;
		}

插入多个字符：

		string& insert(size_t pos, const char* str)
		{
			assert(pos <= _size);
			size_t len = strlen(str);
			if (_size + len > _capacity)
			{
				reserve(_size + len);
			}
            //先把空间腾出来
			size_t end = _size + len;
			while (end >= pos + len)
			{
				_str[end] = _str[end - len];
				--end;
			}
            //再把利用strncpy把指定长度的字符串插入
			strncpy(_str + pos, str, len);
			_size = _size + len;

		}

说了插入就该说删除了.

erase()

这个函数也比较巧妙，首先输入两个参数：第一个参数是要开始删除的下标，第二个参数是要删除的长度.

首先第二个参数默认缺省值是npos，npos是一个非常大的数.

首先判断len是否等于npos或者当前位置+len是否大于总长度，若是，则直接将pos位置置为'\0'，后面的元素也就相当于删除了

如果不是，则把pos+len之后的元素拷贝到pos位置之后，这样就相当于删除了pos~pos+len之间的这一段字符.再把_size-len，相当于是一个覆盖的过程.

		void erase(size_t pos, size_t len = npos)
		{
			assert(pos < _size);
			if (len == npos || pos + len >= _size)
			{
				_str[pos] = '\0';
				_size = pos;
			}
			else
			{
				strcpy(_str + pos, _str + pos + len);
				_size -= len;
			}
		}

find()

也是实现两个，利用strstr()函数来查找字符串.

1.如果查找一个字符

如果找到，则直接返回字符所对应的下标pos，否则返回npos.

2.如果查找一个字符串

对于这种情况，找到字符串后，我们需要返回第一个字符的下标，通过指针差值确定目标字符串的位置。

1.查找一个字符

思路很简单，就是利用循环

		size_t find(char ch, size_t pos = 0)
		{
			assert(pos < _size);
			for (size_t i = pos; i < _size; i++)
			{
				if (ch == _str[i])
				{
					return i;
				}
			}
			return npos;
		}

2.查找一个字符串

利用strstr函数，从第pos个位置开始查找，如果找到则返回目标字符串的首元素地址，若没有找到则返回空指针

		size_t find(const char* sub, size_t pos = 0)
		{
			assert(sub);
			assert(pos < _size);

			const char* ptr = strstr(_str + pos, sub);
			if (ptr == nullptr)
			{
				return npos;
			}
			else
			{
				return ptr - _str;
			}
		}

substr()

这个函数实现比较简单，复用之前实现的+=即可

首先计算出实际要切割的长度realLen = len

如果pos+len>_size或者len == npos,则需要重新计算realLen = _size - pos

然后循环realLen次，创建一个string类型的sub变量，每次利用sub+=这个字符即可.

		string substr(size_t pos, size_t len = npos)
		{
			assert(pos < _size);
			size_t realLen = len;
			if (len == npos || pos + len > _size)
			{
				realLen = _size - pos;
			}
			string sub;
			for (size_t i = 0; i < realLen; i++)
			{
				sub += _str[pos + i];
			}

			return sub;
		}

比较大小函数

实现比较大小，只需要实现两个运算符重载即可：

1. > 或 <其中任意一个

2.==

剩下的>=、<=、!=等等复用即可.

实现> 或 < 时，利用strcmp比较函数即可.

		bool operator >(const string& s) const
		{
			return strcmp(_str, s._str) > 0;
		}

		bool operator ==(const string& s) const
		{
			return strcmp(_str, s._str) == 0;
		}
		bool operator >= (const string& s) const
		{
			return *this > s || *this == s;
		}
		bool operator <(const string& s) const
		{
			return !(*this >= s);
		}
		bool operator <=(const string& s) const
		{
			return !(*this > s);
		}
		bool operator !=(const string& s)
		{
			return !(*this == s);
		}

这样string的模拟实现基本就完成了，下面是总代码：

namespace hmylq
{
	class string
	{
	public:
		typedef char* iterator;
		typedef const char* const_iterator;

		string(const char* str = "")
		{
			_size = strlen(str);
			_capacity = _size;
			_str = new char[_capacity + 1];
			strcpy(_str, str);
		}
		//拷贝构造 - - - 1
		string(const string& s)
			:_str(new char[s._capacity + 1])
			, _size(s._size)
			, _capacity(s._capacity)
		{
			strcpy(_str, s._str);
		}
		//拷贝构造 - - - 2
	/*	string(const string& s)
			:_str(nullptr)
			, _size(0)
			, _capacity(0)
		{
			string tmp(s._str);
			swap(_str, tmp._str);
			swap(_size, tmp._size);
			swap(_capacity, tmp._capacity);
		}*/

		//析构函数
		~string()
		{
			delete[] _str;
			_str = nullptr;
			_size = _capacity = 0;
		}

		iterator begin()
		{
			return _str;
		}

		iterator end()
		{
			return _str + _size;
		}

		const_iterator begin() const
		{
			return _str;
		}

		const_iterator end() const
		{
			return _str + _size;
		}

		/
		void push_back(char ch)
		{
			/*if (_size == _capacity)
			{
				reserve(_capacity == 0 ? 4 : _capacity * 2);
				_str[_size] = ch;
				++_size;
				_str[_size] = '/0';
			}*/
			insert(_size, ch);
		}

		string& operator += (char ch)
		{
			push_back(ch);

			return *this;
		}

		void append(const char* str)
		{
			/*size_t len = strlen(str);
			if (_size + len > _capacity)
			{
				reserve(_size + len);
			}
			strcpy(_str + _size, str);
			_size = _size + len;*/
			insert(_size, str);
		}

		string& operator += (const char* str)
		{
			append(str);

			return *this;
		}

		//= 运算符重载
		string& operator=(const string& s)
		{
			if (this != &s)
			{
				delete[] _str;
				_str = new char[s._capacity + 1];
				strcpy(_str, s._str);
				_size = s._size;
				_capacity = s._capacity;
				return *this;
			}
		}

		void clear()
		{
			_str[0] = '\0';
			_size = 0;
		}

		void swap(string& tmp)
		{
			::swap(_str, tmp._str);
			::swap(_size, tmp._size);
			::swap(_capacity, tmp._capacity);
		}

		const char* c_str() const
		{
			return _str;
		}
		//
		size_t size() const
		{
			return _size;
		}

		size_t capacity() const
		{
			return _capacity;
		}

		bool empty() const
		{
			return _size == 0;
		}

		void resize(size_t n, char ch = '\0')
		{
			if (n > _size)
			{
				reserve(n);
				for (size_t i = _size; i < n; i++)
				{
					_str[i] = ch;
				}
				_str[n] = '\0';
				_size = n;
			}
			else
			{
				_str[n] = '\0';
				_size = n;
			}
		}

		void reserve(size_t n)
		{
			if (n > _capacity)
			{
				char* tmp = new char[n + 1];
				strcpy(tmp, _str);
				delete[] _str;

				_str = tmp;
				_capacity = n;
			}
		}

		/
		char& operator[](size_t index)
		{
			assert(index < _size);

			return _str[index];

		}

		const char& operator[](size_t index) const
		{
			assert(index < _size);

			return _str[index];
		}

		//

		bool operator >(const string& s) const
		{
			return strcmp(_str, s._str) > 0;
		}

		bool operator ==(const string& s) const
		{
			return strcmp(_str, s._str) == 0;
		}
		bool operator >= (const string& s) const
		{
			return *this > s || *this == s;
		}
		bool operator <(const string& s) const
		{
			return !(*this >= s);
		}
		bool operator <=(const string& s) const
		{
			return !(*this > s);
		}
		bool operator !=(const string& s)
		{
			return !(*this == s);
		}

		size_t find(char ch, size_t pos = 0)
		{
			assert(pos < _size);
			for (size_t i = pos; i < _size; i++)
			{
				if (ch == _str[i])
				{
					return i;
				}
			}
			return npos;
		}
		size_t find(const char* sub, size_t pos = 0)
		{
			assert(sub);
			assert(pos < _size);

			const char* ptr = strstr(_str + pos, sub);
			if (ptr == nullptr)
			{
				return npos;
			}
			else
			{
				return ptr - _str;
			}
		}

		string& insert(size_t pos, char ch)
		{
			assert(pos <= _size);
			if (_size == _capacity)
			{
				reserve(_capacity == 0 ? 4 : _capacity * 2);
			}
			size_t end = _size + 1;
			while (end > pos)
			{
				_str[end] = _str[end - 1];
				--end;
			}
			_str[pos] = ch;
			++_size;
			return *this;
		}

		string& insert(size_t pos, const char* str)
		{
			assert(pos <= _size);
			size_t len = strlen(str);
			if (_size + len > _capacity)
			{
				reserve(_size + len);
			}
			size_t end = _size + len;
			while (end >= pos + len)
			{
				_str[end] = _str[end - len];
				--end;
			}
			strncpy(_str + pos, str, len);
			_size = _size + len;

		}

		void erase(size_t pos, size_t len = npos)
		{
			assert(pos < _size);
			if (len == npos || pos + len >= _size)
			{
				_str[pos] = '\0';
				_size = pos;
			}
			else
			{
				strcpy(_str + pos, _str + pos + len);
				_size -= len;
			}
		}

		string substr(size_t pos, size_t len = npos)
		{
			assert(pos < _size);
			size_t realLen = len;
			if (len == npos || pos + len > _size)
			{
				realLen = _size - pos;
			}
			string sub;
			for (size_t i = 0; i < realLen; i++)
			{
				sub += _str[pos + i];
			}

			return sub;
		}

	private:
		char* _str;
		int _size;
		int _capacity;
		const static size_t npos = -1;
	};
}

总结

到此这篇关于C++ STL之string的模拟实现的文章就介绍到这了,更多相关C++ STL string模拟实现内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们！

关于C++STL string类的介绍及模拟实现

目录一.标准库中的string类 1.string类 2.string类中的常用接口说明+模拟实现 2.1 string类对象的常见构造+模拟实现 2.2 string类对象的容量操作+模拟实现 2.3 string类对象的访问及遍历操作+模拟实现 2.4 string类对象的修改操作+模拟实现 2.5 string类非成员函数+模拟实现一.标准库中的string类 1.string类字符串的表示字符序列的类标准的字符串类提供了对此类对象的支持,其接口类似于标准字符容器的接口,但添加了专
C++ STL之string的模拟实现实例代码

目录前言构造函数析构函数拷贝构造函数 operator=赋值运算符重载 c_str operator[] size() capacity() empty() operator+= 扩容函数(reserve) resize() push_back() append() insert() erase() find() 1.查找一个字符 2.查找一个字符串 substr() 比较大小函数总结前言上一章我们对string的常见接口及使用进行了讲解,接下来我们将对一些常见的接口,包括构造函数
利用Python实现Windows下的鼠标键盘模拟的实例代码

本文介绍了利用Python实现Windows下的鼠标键盘模拟的实例代码,分享给大家本来用按键精灵是可以实现我的需求,而且更简单,但既然学python ,就看一下呗. 依赖: PyUserInput pip install PyUserInput PyUserInput 依赖 pyhook,所以还得安装 pyhook.按需下载,下载地址. 我是 win10 64 位 python 2.7,用的是第二个,下载之后用解压软件打开,把 pyHook放到C:\Python27\Lib\site-pack
C++ string 字符串查找匹配实例代码

在写C++程序中,总会遇到要从一个字符串中查找一小段子字符串的情况,对于在C中,我们经常用到strstr()或者strchr()这两种方法.而对于C++的string,我们往往会用到find(). C++:#inlcude<string> C: #include<string.h> find():在一个字符串中查找一个指定的单个字符或字符数组.如果找到,就返回首次匹配的开始位置:如果没有查找到匹配的内容,就返回string::npos. find_first_of():在一个目标串
C++ string替换指定字符实例代码

前言 C++的string提供了replace方法来实现字符串的替换,但是有时候我们想要实现类似JAVA中的替换功能--将string中的某个字符a全部替换成新的字符b,这个功能在提供的replace方法中并没有实现. 不过只要再深入了解一下STL,就可以在变易算法中找到解决方案--使用#include<algorithm>中的replace算法即可. 测试代码如下: #include<algorithm> #include<string> #include<io
实例代码讲解JAVA 观察者模式

当对象间存在一对多关系时,则使用观察者模式(Observer Pattern).比如,当一个对象被修改时,则会自动通知依赖它的对象.观察者模式属于行为型模式. 介绍意图:定义对象间的一种一对多的依赖关系,当一个对象的状态发生改变时,所有依赖于它的对象都得到通知并被自动更新. 主要解决:一个对象状态改变给其他对象通知的问题,而且要考虑到易用和低耦合,保证高度的协作. 何时使用:一个对象(目标对象)的状态发生改变,所有的依赖对象(观察者对象)都将得到通知,进行广播通知. 如何解决:使用面向对象技术
使用C++的string实现高精度加法运算的实例代码

对于超大数字的运算,用long long int仍然不能解决,这时候就需要考虑通过模拟运算和数组存储来实现高精度运算. 本文讨论借助C++的string来实现高精度的运算. 首先输入的量直接存储为string,设为s1和s2. 接下来设计一个反转函数,用于把整个字符串反转(为了方便后续计算). string reverseStr(string input){ string output = ""; for(int i = 0; i < input.length(); i++){
Android 模拟新闻APP显示界面滑动优化实例代码

内容: 1.滑动优化(滑动时不加载图片,停止才加载) 2.第一次进入时手动加载代码如下: 1.界面布局 <?xml version="1.0" encoding="utf-8"?> <LinearLayout xmlns:android="http://schemas.android.com/apk/res/android" android:orientation="horizontal" android:
Android模拟强制下线通知功能实例代码

package com.itheima74.broadcastbestpractice; import android.content.Intent; import android.os.Bundle; import android.os.SystemClock; import android.support.v4.content.LocalBroadcastManager; import android.view.View; /** * 模拟强制下线通知 * 1.登录成功后10秒发送一条本地自
STL 的string类怎么啦

STL 的string类怎么啦?陈皓前言上个周末在和我的同学爬香山闲聊时,同学说到STL中的string类曾经让他备受折磨,几年前他开发一个系统前对string类还比较清楚,然后随着程序的复杂度的加深,到了后期,他几乎对string类失去了信心和信任,他觉得他对string类一头雾水.老实说,我几年前也有同样的痛苦(就是当我写下<标准C++类string的Copy-On-Write技术>之前的一段时间).那时,我不得不研究那根本不是给人看的SGI出品的string类的源码,代码的可读性几乎
C# 模拟浏览器并自动操作的实例代码

本文主要讲解通过WebBrowser控件打开浏览页面,并操作页面元素实现自动搜索功能,仅供学习分享使用,如有不足之处,还请指正. 涉及知识点 WebBrowser:用于在WinForm窗体中,模拟浏览器,打开并导航网页. HtmlDocument:表示一个Html文档的页面.每次加载都会是一个全新的页面. GetElementById(string id):通过ID或Name获取一个Html中的元素. HtmlElement:表示一个Html标签元素. BackgroundWorker 后台执行