C++入门之vector的底层实现详解
目录
- 前言
- 定义初始结构
- 声明构造函数
- 容量有关操作
- 获取有效数据大小size()
- 获取数据容量capacity()
- 增加容量reserve()
- 重置大小resize()
- 迭代器
- 数据操作
- 尾插push_back()
- 尾删pop_back()
- 某一位置插入 insert()
- 某一位置删除 erase()
- 拷贝构造
- []访问操作
- =赋值操作
- 特别注意!!!
- 总结
前言
上一小节,我们讲解了vector的使用,也大概了解了其创建对象,增删改查数据等操作.那么今天,我们就来大致实现一下吧.
定义初始结构
在标准C++中,vector同样是一个模板,并且其底层实现用的是三个指针,然后利用这三个指针相互加减,达到存储效果.
而vector和string类似,本质是都是一个顺序表.
template <class T> class vector { public: ~vector() { delete _start; _start = _finish = _end_of_storage = nullptr; } private: T* _start; //顺序表的头 T* _finish; //顺序表有效长度位置 T* _end_of_storage; //顺序表末尾 };
声明构造函数
上一章节已经讲解,构造函数比较多,这里只是为了简单实现,所以博主就实现一个最简单的构造函数,即无参构造.
vector():_start(nullptr),_finish(nullptr),_end_of_storage(nullptr) {}
容量有关操作
获取有效数据大小size()
想要获取size,该怎么实现呢?我们在定义初始结构的时候,已经知道其底层是利用的三个指针,所以size等于_finish - _start.
size_t size() const //加const是保证const对象也可以用 { return _finish - _start; }
获取数据容量capacity()
同样的道理,capacity就应是_end_of_storage - _start;
size_t capacity() //加const是保证const对象也可以用 { return _end_of_storage - _start; }
增加容量reserve()
我们在后面会实现一个接口,叫做push_back(),它的作用是把数据放进vector,但如果空间不足了呢?这就需要我们的增容函数reserve了.
其参数是无符号整型n,代表要开n个空间
void reserve(size_t n) { if (n > capacity()) { T* tmp = new T[n]; //先开辟一块空间 size_t sz = size(); //保留原来的有效数据大小,且一定要先保存 if (_start) //一定要判断这个,因为最开始_start为空,那么就只需要开空间 { memcpy(tmp, _start, sizeof(T) * n); //把原来的数据拷贝进新空间 delete _start; //释放原来的空间 } _start = tmp; //移交空间 _finish = _start + sz; //更新_finish _end_of_storage = _start + n; //更新_end_of_storage } }
重置大小resize()
这个想必大家现在已经比较习惯了吧?他有两个参数,会分情况讨论是否大于size()而进行参数赋值.
void resize(size_t n,const T& val = T()) { if(n>capacity()) reserve(n); for(size_t i = size();i<n;i++) { _start[i] = val; } _finish = _start + n; }
迭代器
前面讲解string的时候说过,现阶段我们就把迭代器当做一个指针,**虽然指针一定是迭代器,但是迭代器不一定是指针.**但是目前阶段我们用到的迭代器就是一个指针,因此这里便直接定义迭代器了
typedef T* iterator; //普通迭代器 typedef const T* const_iterator; //const迭代器 //因此返回首尾迭代器的接口,博主便一并写下来 iterator begin() {return _start;} iterator end() {return _finish;} //普通接口 const_iterator begin() const {return _start;} const_iterator end() const {return _finish;} //const接口
数据操作
尾插push_back()
该接口的实现操作一般是先检查容量是否充足,然后把数据放进去,最后size大小加一.
void push_back(const T& val) { if(size() == capacity()) { size_t newcapacity = size()==0?4:capacity()*2; //需要考虑到size是否有可能为0的情况 reserve(newcapacity); } *_finish = val; _finish++; }
尾删pop_back()
实现该接口的操作一般是先检查是否还存在数据,然后size大小减一
void pop_back() { assert(size()>0); _finish--; }
某一位置插入 insert()
同样的道理,一般先检查容量是否充足,如果不够,需要警惕迭代器失效问题,然后移动该位置及以后的所有数据,最后插入数据.
官方文档定义其返回值为新插入数据的位置
iterator insert(iterator pos,const T& val) { assert(pos>=_start && pos <= _finish); if(_finish == _end_of_storage) { int n = pos - _start; size_t newcapacity = 0 ? 4 :capacity()*2; pos = _start + n; //防止pos迭代器失效 } iterator cur = end(); while(cur > pos) { *cur = *(cur-1); cur--; } *pos = val; _finish++; return pos; }
某一位置删除 erase()
该接口的操作一般是从pos后位置开始,所有数据前挪一单位.但是在挪之前,需要检查是否还存在数据
官方文档定义其返回值为删除数据的下一位置
iterator erase(iterator pos) { assert(pos >= _start && pos < _finish); iterator it = pos + 1; while (it != _finish) { *(it-1) = *it; ++it; } --_finish; return pos; }
拷贝构造
vector(const vector<T>& v):_start(nullptr), _finish(nullptr), _end_of_storage(nullptr) { reserve(v.capacity()); for (const auto& e : v) { push_back(e); } }
[]访问操作
上面我们实现了迭代器,但是vector还支持[]索引取值,博主这里便实现两个[]重载吧
T& operator[](size_t i) { assert(i < size()); return _start[i]; } const T& operator[](size_t i) const { assert(i < size()); return _start[i]; }
=赋值操作
vector<T>& operator=(vector<T> v) //注意哦~,我这里故意写的传值参数,而不是引用,是为了下面进行交换 { swap(*this,v); return *this; }
特别注意!!!
在实现了上面的一系列操作以后,有没有觉得我们已经大功告成了?其实这里还隐藏着一个小小bug!.为什么呢?看下面'
int main() { //我们假设最开始创建的vector的容量是4 vector<string> vc; vc.push_back("123"); //创建vc,并给其赋值 vc.push_back("234"); vc.push_back("345"); vc.push_back("456"); vc.push_back("567"); return 0; }
初一看,好像并没有什么错误哎?但是一运行就会发现,当插入第5个元素的时候,就报错了.这是什么原因呢?
调试发现,问题出在了reserve上面,因为push_back之前,会检查容量,那么我们现在重新瞅瞅 reserve存在什么问题呢?
void reserve(size_t n) { if (n > capacity()) { T* tmp = new T[n]; //先开辟一块空间 size_t sz = size(); //保留原来的有效数据大小,且一定要先保存 if (_start) //一定要判断这个,因为最开始_start为空,那么就只需要开空间 { memcpy(tmp, _start, sizeof(T) * n); //把原来的数据拷贝进新空间 delete _start; //释放原来的空间 } _start = tmp; //移交空间 _finish = _start + sz; //更新_finish _end_of_storage = _start + n; //更新_end_of_storage } }
大家有发现什么问题了吗?
没错,问题出现在memcpy上面,当容量不足,reserve就会增加容量,然后把原来空间的内容值拷贝到新空间.
但是原来空间的内容也就只有三个指针呀,拷贝过去后,新空间和源空间都指向了同一块空间,而我们又会释放原空间.
所以,当继续尾插第5个元素时候,就报错了,因为空间已经不存在了!!!,被释放了.
那怎么解决呢?这里便只能用循环,把string值赋给新空间了.
void reserve(size_t n) { if (n > capacity()) { size_t sz = size(); T* tmp = new T[n]; if (_start) { for (size_t i = 0; i < sz; ++i) { tmp[i] = _start[i]; } delete[] _start; } _start = tmp; _finish = _start + sz; _endofstorage = _start + n; }
总结
本篇文章就到这里了,希望能够给你带来帮助,也希望您能够多多关注我们的更多内容!