c++字符串分割的方法

C++ 中经常需要对字符串按照分隔符进行分割以获得子串序列,子串的顺序与其在原字符串中出现的顺序一致。一般有两种需求场景:
 (1)给定一个分隔符(单个字符或子串)分割字符串;
 (2)给定一个或多个分隔符(单个字符),分割字符串。

当给定的分隔符不在原字符串中,则原字符串不被分割,返回单个元素为原字符串的 vector。

注意,本文实现时,如果被分割后的子串为空串,则不计入最终的子串序列。比如原字符串是"a,b",分隔符为",",那么分割后的子串序列为 [“a”, “b”],而不是 [“a”, “”, “b”]。

1.单个分隔符(单个字符或子串)分割字符串

#include <iostream>
#include <vector>
#include <string>
using namespace std;

//@brief: 指定单个分隔符(单个字符或子串)分割字符串
//@param: src 原字符串;delimiter 分隔符,单个字符或子串
vector<string> splitStr(const string& src, const string& delimiter) {
	std::vector<string> vetStr;

	// 入参检查
	// 1.原字符串为空或等于分隔符,返回空 vector
	if (src == "" || src == delimiter) {
		return vetStr;
	}
	// 2.分隔符为空返回单个元素为原字符串的 vector
	if (delimiter == "") {
		vetStr.push_back(src);
		return vetStr;
	}

	string::size_type startPos = 0;
	auto index = src.find(delimiter);
	while (index != string::npos) {
		auto str = src.substr(startPos, index - startPos);
		if (str != "") {
			vetStr.push_back(str);
		}
		startPos = index + delimiter.length();
		index = src.find(delimiter, startPos);
	}
	// 取最后一个子串
	auto str = src.substr(startPos);
	if (str != "") {
		vetStr.push_back(str);
	}

	return vetStr;
}

测试如下:

int main(int argc, char* argv[]) {
	string str = "I,love,China";

	// 正常分割
	auto vetStr = splitStr(str, ",");
	cout << "vetStr.size() = " << vetStr.size() << endl;
	for (auto v : vetStr) {
		cout << v << " ";
	}

	// 边界测试
	vetStr = splitStr(str, "I,");
	cout << endl << "vetStr.size() = " << vetStr.size() << endl;
	for (auto v : vetStr) {
		cout << v << " ";
	}

	// 不包含分隔符
	vetStr = splitStr(str, "what");
	cout << endl << "vetStr.size() = " << vetStr.size() << endl;
	for (auto v : vetStr) {
		cout << v << " ";
	}
	return 0;
}

输出结果:

vetStr.size() = 3
I love China
vetStr.size() = 1
love,China
vetStr.size() = 1
I,love,China

2.单个或多个分隔符(单个字符)分割字符串

实现和单个分隔符(单个字符或子串)分割字符串基本一致,关键地方是将获取分隔符下标的函数由 std::string::find(…) 改为 std::string::find_first_of(…)。二者的区别如下:

std::string::find(...)
 将分隔符看作一个整体在原字符串中查找并返回匹配的下标,比如 string("I love China").find("love") 返回 2。
std::string::find_first_of(...)
 在字符串中搜索分隔符中任意一个字符出现的第一个位置。与 std::string::find(...) 的区别是不需要整个分隔符匹配,只需要分隔符中的单个字符匹配即可。

具体实现如下:

//@brief: 指定单个或多个分隔符(单个字符)分割字符串
//@param: src 原字符串;delimiter 单个或多个分隔符(单个字符)
vector<string> splitStr(const string& src, const string& delimiter) {
	std::vector<string> vtStr;

	// 入参检查
	// 1.原字符串为空返回空 vector
	if (src == "") {
		return vtStr;
	}
	// 2.分隔符为空返回单个元素为原字符串的 vector
	if (delimiter == "") {
		vtStr.push_back(src);
		return vtStr;
	}

	string::size_type startPos = 0;
	auto index = src.find_first_of(delimiter);
	while (index != string::npos) {
		auto str = src.substr(startPos, index - startPos);
		if (str != "") {
			vtStr.push_back(str);
		}
		startPos = index + 1;
		index = src.find_first_of(delimiter, startPos);
	}
	// 取最后一个子串
	auto str = src.substr(startPos);
	if (str != "") {
		vtStr.push_back(str);
	}

	return vtStr;
}

测试如下:

int main(int argc, char* argv[]) {
	string str = "I,love,China";

	// 正常分割。按照 h 与逗号分割
	auto vetStr = splitStr(str, "h,");
	cout << "vetStr.size() = " << vetStr.size() << endl;
	for (auto v : vetStr) {
		cout << v << " ";
	}

	// 边界测试
	vetStr = splitStr(str, "Ia");
	cout << endl << "vetStr.size() = " << vetStr.size() << endl;
	for (auto v : vetStr) {
		cout << v << " ";
	}

	// 不包含分隔符
	vetStr = splitStr(str, "_:");
	cout << endl << "vetStr.size() = " << vetStr.size() << endl;
	for (auto v : vetStr) {
		cout << v << " ";
	}
	return 0;
}

输出结果:

vetStr.size() = 4
I love C ina
vetStr.size() = 1
,love,Chin
vetStr.size() = 1
I,love,China

3.反面实例

下面是我情急之下实现的单个或多个分隔符(单个字符)分割字符串的函数,有点“脏乱差”,作为反面教材,希望能够帮助大家时刻记住代码的简洁与优雅是多么可贵,大家可以对比感受一下。另外,适当的代码注释,对提高代码的可读性会有很大帮助。

脏乱差版本一:

//qsort函数需要的比较函数,按照升序排序
int comp(const void*a,const void*b) {
	return *(int*)a-*(int*)b;
}

//@brief: 指定单个或多个分隔符(单个字符)分割字符串
//@param: src 原字符串;delimiter 分隔符集合
vector<string> splitStr(const string& src,const string& delimiter) {
	vector<string> strRes;
	int maxSubstrNum=src.size();
	int* pos=new int[maxSubstrNum];
	memset(pos,0,maxSubstrNum*sizeof(int));

	int j=0;
	for(size_t i=0;i<delimiter.size();++i) {
		string::size_type index=src.find(delimiter[i]);
		while(index!=string::npos) {
			pos[j++]=index;
			index=src.find(delimiter[i],index+1);
		}
	}
	//排序
	qsort(pos,j,sizeof(int),comp);
	//取出第一个子串
	string substrFir=src.substr(0,pos[0]);
	if(substrFir!="")
		strRes.push_back(substrFir);
	//取出中间j-1个子串
	for(int i=0;i<j-1;++i) {
		string substr=src.substr(pos[i]+1,pos[i+1]-pos[i]-1);
		if(substr!="") {
			strRes.push_back(substr);
		}
	}
	//取出最后一个子串
	string substrLast=src.substr(pos[j-1]+1,src.size()-pos[j-1]-1);
	if(substrLast!="") {
		strRes.push_back(substrLast);
	}
	delete[] pos;
	return strRes;
}

代码主要说明:
 (1)利用 find() 和 substr() 函数实现分割功能;
 (2)代码中,需要对分割符出现的下标进行排序,这样才能顺序取出子串。

脏乱差版本二:

//@brief: 指定单个或多个分隔符(单个字符)分割字符串
//@param: src 原字符串;delimiter 分隔符集合
std::vector<std::string> splitStr(const std::string &sStr, const std::string &sSep) {
  std::vector<std::string> vt;

  std::string::size_type pos = 0;
  std::string::size_type pos1 = 0;
  int pos_tmp = -1;

  while(true) {
    std::string s;
    std::string s1;
    pos1 = sStr.find_first_of(sSep, pos);
    if(pos1 == std::string::npos) {
      if(pos + 1 <= sStr.length()) {
        s = sStr.substr(-1 != pos_tmp ? pos_tmp : pos);
        s1 = "";
      }
    } else if(pos1 == pos && (pos1 + 1 == sStr.length())) {
      s = "";
      s1 = "";
    } else {
      s = sStr.substr(-1 != pos_tmp ? pos_tmp : pos, pos1 - (-1 != pos_tmp ? pos_tmp : pos));
      s1 = sStr.substr(pos1 + 1);
      if (-1 == pos_tmp) {
        pos_tmp = pos;
      	}
      pos = pos1;
    }

    if(!s.empty()) {
      vt.push_back(s);
    }
    pos_tmp = -1;

    if(pos1 == std::string::npos) {
      break;
    }

    pos++;
  }

  return vt;
}

以上就是c++字符串分割的方法的详细内容,更多关于C++ 字符串分割的资料请关注我们其它相关文章!

(0)

相关推荐

  • 详解C++的String类的字符串分割实现

    详解C++的String类的字符串分割实现 功能需求,输入一个字符串"1-2-3"切割出"1"."2"."3".在Java下直接用String的split函数就可以了.c++下String没有直接提供这个函数,需要自己写. 网上给出的解决方案是这里的三种方法.但我是通过JNI访问的,在里面用这些vector可能不中,自己封装了个,仅供参考: String recogScop = "01-02-03"; co

  • C++的字符串分割函数的使用详解

    经常碰到字符串分割的问题,这里总结下,也方便我以后使用. 一.用strtok函数进行字符串分割 原型: char *strtok(char *str, const char *delim); 功能:分解字符串为一组字符串. 参数说明:str为要分解的字符串,delim为分隔符字符串. 返回值:从str开头开始的一个个被分割的串.当没有被分割的串时则返回NULL. 其它:strtok函数线程不安全,可以使用strtok_r替代. 示例: //借助strtok实现split #include <st

  • 如何在c++中实现字符串分割函数split详解

    前言 在学习c++中string相关基本用法的时候,发现了sstream的istringstream[1]可以将字符串类似于控制台的方式进行输入,而实质上这个行为等同于利用空格将一个字符串进行了分割,于是考虑到可以利用这个特性来实现c++库函数中没有的字符串分割函数split string src("Avatar 123 5.2 Titanic K"); istringstream istrStream(src); //建立src到istrStream的联系 string s1, s2

  • C++常用字符串分割方法实例汇总

    本文实例汇总了C++常用字符串分割方法,分享给大家供大家参考.具体分析如下: 我们在编程的时候经常会碰到字符串分割的问题,这里总结下,也方便我们以后查询使用. 一.用strtok函数进行字符串分割 原型: char *strtok(char *str, const char *delim); 功能:分解字符串为一组字符串. 参数说明:str为要分解的字符串,delim为分隔符字符串. 返回值:从str开头开始的一个个被分割的串.当没有被分割的串时则返回NULL. 其它:strtok函数线程不安全

  • c++如何分割字符串示例代码

    话不多说,直接上代码 如果需要根据单一字符分割单词,直接用getline读取就好了,很简单 #include <iostream> #include <vector> #include <string> #include <sstream> using namespace std; int main() { string words; vector<string> results; getline(cin, words); istringstre

  • c++字符串分割的方法

    C++ 中经常需要对字符串按照分隔符进行分割以获得子串序列,子串的顺序与其在原字符串中出现的顺序一致.一般有两种需求场景:  (1)给定一个分隔符(单个字符或子串)分割字符串:  (2)给定一个或多个分隔符(单个字符),分割字符串. 当给定的分隔符不在原字符串中,则原字符串不被分割,返回单个元素为原字符串的 vector. 注意,本文实现时,如果被分割后的子串为空串,则不计入最终的子串序列.比如原字符串是"a,b",分隔符为",",那么分割后的子串序列为 [&quo

  • JavaScript字符串对象split方法入门实例(用于把字符串分割成数组)

    JavaScript split 方法 split 方法用于将字符串分割为字符串数组并返回该数组.其语法如下: 复制代码 代码如下: str_object.split(separator, limit) 参数说明: 参数 说明 str_object 要操作的字符串(对象) separator 必需.分隔符,字符串或正则表达式,从该参数指定的地方分割 str_object limit 可选.指定返回的数组的最大长度.如果设置了该参数,返回的子串不会多于这个参数指定的数组.如果省略该参数,则符合规则

  • js使用split函数按照多个字符对字符串进行分割的方法

    本文实例讲述了js使用split函数按照多个字符对字符串进行分割的方法.分享给大家供大家参考.具体分析如下: js中的split()函数可以对字符串按照指定的符号进行分割,但是如果字符串中存在多个分割符号,js的split()函数是否还可以胜任呢,答案是肯定的,js的split()函数可以通过正则表达式实现多分隔符的字符串分割,调用也很简单,下面是详细范例. 下面的代码可以通过js split方法对字符串按照逗号分割 var mystring = "a,b,c,d,e"; var my

  • c语言中字符串分割函数及实现方法

    1.问题引入 自己在写一个linux下的模拟执行指令的时候,遇到了输入"cat a.c",要将该字符串分解成cat和a.c两个单独的字符串,虽然知道有strtok的存在,但是想自己尝试写一下,于是就自己写了一个,不过总是遇到这样或那样的问题,虽然最后调通了,不过确浪费了不少时间:后来作业交上去以后又仔细阅读了strtok函数,发现原来linux下已经改成strsep,所有在这里就写一下自己所走的过程. 2.自己写的字符串分割函数:用于分割指令,比如cat a.c最后会被分割成cat和a

  • java 字符串分割的三种方法(总结)

    最近在项目中遇到一个小问题,一个字符串分割成一个数组,类似String str="aaa,bbb,ccc"; 然后以","为分割符,将其分割成一个数组,用什么方法去实现呢? 第一种方法: 可能一下子就会想到使用split()方法,用split()方法实现是最方便的,但是它的效率比较低 第二种方法: 使用效率较高的StringTokenizer类分割字符串,StringTokenizer类是JDK中提供的专门用来处理字符串分割子串的工具类.它的构造函数如下: publ

  • php实现将字符串按照指定距离进行分割的方法

    本文实例讲述了php实现将字符串按照指定距离进行分割的方法.分享给大家供大家参考.具体如下: 将一个字符串每隔三个字符添加一个逗号,例如把字符串1234567890转换为1,234,567,890,这种做法在金融领域非常常见 <?php /** * 每隔3个字符,用逗号进行分隔 * @param string $str * @return string */ function splitStrWithComma ($str) { $arr = array(); $len = strlen($st

  • python按照多个字符对字符串进行分割的方法

    本文实例讲述了python按照多个字符对字符串进行分割的方法.分享给大家供大家参考.具体分析如下: 这段python代码通过这规则表达式对字符串进行分割,使用\w作为分割符,只要不是字母和数字的就会被分割开来. import re DATA = "Hey, you - what are you doing here! welcome to jb51?" print re.findall(r"[\w']+", DATA) 输出结果如下 复制代码 代码如下: ['Hey

  • Python使用正则表达式分割字符串的实现方法

    如下: re.split(pattern, string, [maxsplit], [flags]) pattern:表示模式字符串,由要匹配的正则表达式转换而来. string:表示要匹配的字符串. maxsplit:可选参数,表示最大的拆分次数. flags:可选参数表示标志位,用于控制匹配方式,如是否区分子母大小写 示例代码: import re pattern = r'[?|&]' # 定义分隔符 url = 'http://www.baidu.com/login.jsp?usernam

  • JavaScript字符串分割处理的方法总结

    目录 1.slice(start, end) 2.substr(start, length) 3.substring(start, stop) 4.split(separator, length) 5.join(separator) 6.splice(start, length, …args) 前言: 前端开发中,字符串处理是比较常见的,笔者在最近复习的过程中也把它整理了出来. 首先,先来看看js截取三姐妹substring().subsstr().slice() 1.slice(start,

随机推荐