C++ 字符串分割

C++ 字符串分割C++中经常需要对字符串按照指定字符或字符串进行分割操作以获得子串。下面给出具体实现。版本一://qsort函数需要的比较函数,按照升序排序intcomp(constvoid*a,constvoid*b){ return*(int*)a-*(int*)b;}//按指定分隔符分割字符串//src:源字符串delimiter:分隔符集合vector<string&…

大家好,又见面了,我是你们的朋友全栈君。

编译运行环境:VS2017 + Win32 + Debug


C++ 中经常需要对字符串按照分隔符进行分割以获得子串序列,子串的顺序与其在原字符串中出现的顺序一致。一般有两种需求场景:
(1)给定一个分隔符(单个字符或子串)分割字符串;
(2)给定一个或多个分隔符(单个字符),分割字符串。

当给定的分隔符不在原字符串中,则原字符串不被分割,返回单个元素为原字符串的 vector。

注意,本文实现时,如果被分割后的子串为空串,则不计入最终的子串序列。比如原字符串是”a,b”,分隔符为”,”,那么分割后的子串序列为 [“a”, “b”],而不是 [“a”, “”, “b”]。

1.单个分隔符(单个字符或子串)分割字符串

#include <iostream>
#include <vector>
#include <string>
using namespace std;

//@brief: 指定单个分隔符(单个字符或子串)分割字符串
//@param: src 原字符串;delimiter 分隔符,单个字符或子串
vector<string> splitStr(const string& src, const string& delimiter) { 
   
	std::vector<string> vetStr;
	
	// 入参检查
	// 1.原字符串为空或等于分隔符,返回空 vector
	if (src == "" || src == delimiter) { 
   
		return vetStr;
	}
	// 2.分隔符为空返回单个元素为原字符串的 vector
	if (delimiter == "") { 
   
		vetStr.push_back(src);
		return vetStr;
	}

	string::size_type startPos = 0;
	auto index = src.find(delimiter);
	while (index != string::npos) { 
   
		auto str = src.substr(startPos, index - startPos);
		if (str != "") { 
   
			vetStr.push_back(str);
		}
		startPos = index + delimiter.length();
		index = src.find(delimiter, startPos);
	}
	// 取最后一个子串
	auto str = src.substr(startPos);
	if (str != "") { 
   
		vetStr.push_back(str);
	}

	return vetStr;
}

测试如下:

int main(int argc, char* argv[]) { 
   
	string str = "I,love,China";

	// 正常分割
	auto vetStr = splitStr(str, ",");
	cout << "vetStr.size() = " << vetStr.size() << endl;
	for (auto v : vetStr) { 
   
		cout << v << " ";
	}

	// 边界测试
	vetStr = splitStr(str, "I,");
	cout << endl << "vetStr.size() = " << vetStr.size() << endl;
	for (auto v : vetStr) { 
   
		cout << v << " ";
	}

	// 不包含分隔符
	vetStr = splitStr(str, "what");
	cout << endl << "vetStr.size() = " << vetStr.size() << endl;
	for (auto v : vetStr) { 
   
		cout << v << " ";
	}
	return 0;
}

输出结果:

vetStr.size() = 3
I love China
vetStr.size() = 1
love,China
vetStr.size() = 1
I,love,China

2.单个或多个分隔符(单个字符)分割字符串

实现和单个分隔符(单个字符或子串)分割字符串基本一致,关键地方是将获取分隔符下标的函数由 std::string::find(…) 改为 std::string::find_first_of(…)。二者的区别如下:

std::string::find(...)
	将分隔符看作一个整体在原字符串中查找并返回匹配的下标,比如 string("I love China").find("love") 返回 2。
std::string::find_first_of(...)
	在字符串中搜索分隔符中任意一个字符出现的第一个位置。与 std::string::find(...) 的区别是不需要整个分隔符匹配,只需要分隔符中的单个字符匹配即可。

具体实现如下:

//@brief: 指定单个或多个分隔符(单个字符)分割字符串
//@param: src 原字符串;delimiter 单个或多个分隔符(单个字符)
vector<string> splitStr(const string& src, const string& delimiter) { 
   
	std::vector<string> vtStr;

	// 入参检查
	// 1.原字符串为空返回空 vector
	if (src == "") { 
   
		return vtStr;
	}
	// 2.分隔符为空返回单个元素为原字符串的 vector
	if (delimiter == "") { 
   
		vtStr.push_back(src);
		return vtStr;
	}

	string::size_type startPos = 0;
	auto index = src.find_first_of(delimiter);
	while (index != string::npos) { 
   
		auto str = src.substr(startPos, index - startPos);
		if (str != "") { 
   
			vtStr.push_back(str);
		}
		startPos = index + 1;
		index = src.find_first_of(delimiter, startPos);
	}
	// 取最后一个子串
	auto str = src.substr(startPos);
	if (str != "") { 
   
		vtStr.push_back(str);
	}

	return vtStr;
}

测试如下:

int main(int argc, char* argv[]) { 
   
	string str = "I,love,China";

	// 正常分割。按照 h 与逗号分割
	auto vetStr = splitStr(str, "h,");
	cout << "vetStr.size() = " << vetStr.size() << endl;
	for (auto v : vetStr) { 
   
		cout << v << " ";
	}

	// 边界测试
	vetStr = splitStr(str, "Ia");
	cout << endl << "vetStr.size() = " << vetStr.size() << endl;
	for (auto v : vetStr) { 
   
		cout << v << " ";
	}

	// 不包含分隔符
	vetStr = splitStr(str, "_:");
	cout << endl << "vetStr.size() = " << vetStr.size() << endl;
	for (auto v : vetStr) { 
   
		cout << v << " ";
	}
	return 0;
}

输出结果:

vetStr.size() = 4
I love C ina
vetStr.size() = 1
,love,Chin
vetStr.size() = 1
I,love,China

3.反面实例

下面是我情急之下实现的单个或多个分隔符(单个字符)分割字符串的函数,有点“脏乱差”,作为反面教材,希望能够帮助大家时刻记住代码的简洁与优雅是多么可贵,大家可以对比感受一下。另外,适当的代码注释,对提高代码的可读性会有很大帮助。

脏乱差版本一:

//qsort函数需要的比较函数,按照升序排序
int comp(const void*a,const void*b) { 
   
	return *(int*)a-*(int*)b;
}

//@brief: 指定单个或多个分隔符(单个字符)分割字符串
//@param: src 原字符串;delimiter 分隔符集合
vector<string> splitStr(const string& src,const string& delimiter) { 
   
	vector<string> strRes;
	int maxSubstrNum=src.size();
	int* pos=new int[maxSubstrNum];
	memset(pos,0,maxSubstrNum*sizeof(int));
	
	int j=0;
	for(size_t i=0;i<delimiter.size();++i) { 
   
		string::size_type index=src.find(delimiter[i]);
		while(index!=string::npos) { 
   
			pos[j++]=index;
			index=src.find(delimiter[i],index+1);
		}		
	}
	//排序
	qsort(pos,j,sizeof(int),comp);
	//取出第一个子串
	string substrFir=src.substr(0,pos[0]);
	if(substrFir!="") 
		strRes.push_back(substrFir);
	//取出中间j-1个子串
	for(int i=0;i<j-1;++i) { 
   
		string substr=src.substr(pos[i]+1,pos[i+1]-pos[i]-1);
		if(substr!="") { 
   
			strRes.push_back(substr);
		}
	}
	//取出最后一个子串
	string substrLast=src.substr(pos[j-1]+1,src.size()-pos[j-1]-1);
	if(substrLast!="") { 
   
		strRes.push_back(substrLast);
	}
	delete[] pos;
	return strRes;
}

代码主要说明:
(1)利用 find() 和 substr() 函数实现分割功能;
(2)代码中,需要对分割符出现的下标进行排序,这样才能顺序取出子串。

脏乱差版本二:

//@brief: 指定单个或多个分隔符(单个字符)分割字符串
//@param: src 原字符串;delimiter 分隔符集合
std::vector<std::string> splitStr(const std::string &sStr, const std::string &sSep) { 
   
    std::vector<std::string> vt;

    std::string::size_type pos = 0;
    std::string::size_type pos1 = 0;
    int pos_tmp = -1;

    while(true) { 
   
        std::string s;
        std::string s1;
        pos1 = sStr.find_first_of(sSep, pos);
        if(pos1 == std::string::npos) { 
   
            if(pos + 1 <= sStr.length()) { 
   
                s = sStr.substr(-1 != pos_tmp ? pos_tmp : pos);
                s1 = "";
            }
        } else if(pos1 == pos && (pos1 + 1 == sStr.length())) { 
   
            s = "";
            s1 = "";
        } else { 
   
            s = sStr.substr(-1 != pos_tmp ? pos_tmp : pos, pos1 - (-1 != pos_tmp ? pos_tmp : pos));
            s1 = sStr.substr(pos1 + 1);
            if (-1 == pos_tmp) { 
   
                pos_tmp = pos;
           	}
            pos = pos1;
        }

        if(!s.empty()) { 
   
            vt.push_back(s);
        }
        pos_tmp = -1;

        if(pos1 == std::string::npos) { 
   
            break;
        }

        pos++;
    }

    return vt;
}

参考文献

[1] C++ Reference.std::string
[2] C++ Reference.std::string::find
[3] C++ Reference.std::string::find_first_of
[4] C++常用字符串分割方法实例汇总

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/131339.html原文链接:https://javaforall.net

(0)
上一篇 2022年6月12日 下午2:46
下一篇 2022年6月12日 下午2:46


相关推荐

  • 什么是单页面应用开发工具_单页面和多页面的区别及优缺点

    什么是单页面应用开发工具_单页面和多页面的区别及优缺点单页面应用开发MPA与SPA简介MPAMPA(Multi-pageApplication)多页面应用指的就是最传统的HTML网页设计,早期的网站都是这样的设计,所之称为「网页设计」。使用MPA在使用者浏览Web时会依据点击需求切换页面,浏览器会不停的重载页面(Reload),整个操作也常感觉卡卡。如果使用这样的设计在WebApp中,使用者体验比较差,整体流畅度扣分…

    2022年10月13日
    3
  • 怎么改变pycharm的背景颜色_pycharm设置成白底

    怎么改变pycharm的背景颜色_pycharm设置成白底进入软件点击File选择Settings点击点击Edito左下角的三角形点击ColorScheme左下角的三角形选择ConsoleFoot点击点击Scheme的选择框选择完毕之后点Ok,会弹出一个选择框,yes代表全部改变,no代表编辑框的背景颜色改变

    2022年8月26日
    10
  • idea导入项目框架的方法

    idea导入项目框架的方法学习时 使用 IDEA 的时候 经常需要导入项目框架 下面操作介绍如何导入项目框架 打开需要导入的项目打开方式 打开 idea 选择 ImportProjec 也可以进入 idea 后 选择 Flie gt New gt ProjectfromE 选择项目文件 点击 ok 出现下面窗口 选择第

    2026年3月20日
    2
  • 豆包与DeepSeek大模型技术架构与能力对比分析:多模态实用主义vs纯文本技术驱动

    豆包与DeepSeek大模型技术架构与能力对比分析:多模态实用主义vs纯文本技术驱动

    2026年3月12日
    2
  • MySQL中的IFNULL函数和IF函数

    MySQL中的IFNULL函数和IF函数nbsp nbsp MySQL 中的 IFNULL 函数类似于 Oracle 中的 NVL 函数 其表达式为 IFNULL expr1 expr2 含义是 如果第一个参数不为空 则返回第一个参数 否则返回第二个参数 nbsp nbsp nbsp nbsp IF expr1 expr2 expr3 类似于 Oracle 中的 NVL2 函数 含义是 如果第一个表达式的值为 TRUE 不为 0 或 null 则返回第二个参数的值 否则返回第三个参数的值

    2026年3月18日
    2
  • mac redis安装_如何启动redis

    mac redis安装_如何启动redisMac安装Redis,原来就是这么简单_MarkJava-CSDN博客_mac安装redis注意:安装brew之前需要切换到普通用户,命令为su用户名。如果在root用户模式下安装报错

    2025年6月9日
    3

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号