c语言strsep,C/C++ 字符串分割: strtok 与 strsep 函数说明(示例代码)

c语言strsep,C/C++ 字符串分割: strtok 与 strsep 函数说明(示例代码)函数原型:char*strtok(char*s,constchar*delim);char*strsep(char**s,constchar*delim);功能:strtok和strsep两个函数的功能都是用来分解字符串为一组字符串。s为要分解的字符串,delim为分隔符字符串。返回值:从s开头开始的一个个子串,当没有分割的子串时返回NULL。相同点:两者都会改变源字符串,想要…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全家桶1年46,售后保障稳定

函数原型:

char *strtok(char *s, const char *delim);

char *strsep(char **s, const char *delim);

功能:strtok和strsep两个函数的功能都是用来分解字符串为一组字符串。s为要分解的字符串,delim为分隔符字符串。

返回值:从s开头开始的一个个子串,当没有分割的子串时返回NULL。

相同点:两者都会改变源字符串,想要避免,可以使用strdupa(由allocate函数实现)或strdup(由malloc函数实现)。

strtok函数第一次调用时会把s字符串中所有在delim中出现的字符替换为NULL。然后通过依次调用strtok(NULL, delim)得到各部分子串。

作用:

分解字符串为一组字符串。s为要分解的字符串,delim为分隔符字符串。

说明:

strtok()用来将字符串分割成一个个片段。参数s指向欲分割的字符串,参数delim则为分割字符串,当strtok()在参数s的字符串中发现到参数delim的分割字符时则会将该字符改为\0 字符。在第一次调用时,strtok()必需给予参数s字符串,往后的调用则将参数s设置成NULL。每次调用成功则返回下一个分割后的字符串指针。

返回值:

从s开头开始的一个个被分割的串。当没有被分割的串时则返回NULL。

所有delim中包含的字符都会被滤掉,并将被滤掉的地方设为一处分割的节点。(如下面的例子,可修改 seps里面的数据,然后看输出结果)

#include #include

char string[] =”A string\tof ,,tokens\nand some more tokens”;char seps[] =”,\t\n”;char *token;int main( void)

{

printf(“%s\n\nTokens:\n”, string);/*Establish string and get the first token:*/token= strtok( string, seps );while( token !=NULL )

{/*While there are tokens in “string”*/printf(“%s\n”, token );/*Get next token:*/token=strtok( NULL, seps );

}return 0;

}

a51bc71f75510155e94a51a6b8c94237.png

总结:

strtok内部记录上次调用字符串的位置,所以不支持多线程,可重入版本为strtok_r,有兴趣的可以研究一下。它适用于分割关键字在字符串之间是“单独”或是 “连续“在一起的情况。

strsep:

#include #include

char string[] =”A string\tof ,,tokens\nand some more tokens”;char seps[] =”,\t\n”;char *token, *s;int main( void)

{

printf(“%s\n\nTokens:\n”, string);/*Establish string and get the first token:*/s=string;

token= strsep( &s, seps );while( token !=NULL )

{/*While there are tokens in “string”*/printf(“%s\n”, token );/*Get next token:*/token= strsep( &s, seps );

}return 0;

}

d02db7f9e92f687940540931ae1f2911.png

为什么用strtok时子串中间没有出现换行,而strsep却有多个换行呢?文档中有如下的解释:

One difference between strsep and strtok_r is that if the input string contains more

than one character from delimiter in a row strsep returns an empty string for each

pair of characters from delimiter. This means that a program normally should test

for strsep returning an empty string before processing it.

大意是:如果输入的串的有连续的多个字符属于delim,(此例source中的逗号+空格,感叹号+空格等就是这种情况),strtok会返回NULL,而strsep会返回空串””。因而我们如果想用strsep函数分割字符串必须进行返回值是否是空串的判断。这也就解释了strsep的例子中有多个换行的原因。

改进后的代码:

a14f2500fd01751afe93a045a5585a7b.png

效果:

94e2b1bbe2d5ec666d1effa72005f262.png

其中,  字符‘\0’  的 10进制数为0 , 宏定义为NULL  。

下面的说明摘自于最新的Linux内核2.6.29,说明了strtok()已经不再使用,由速度更快的strsep()代替。

/** linux/lib/string.c** Copyright (C) 1991, 1992 Linus Torvalds*/

/** stupid library routines.. The optimized versions should generally be found

* as inline code in

* These are buggy as well..

* * Fri Jun 25 1999, Ingo Oeser

* – Added strsep() which will replace strtok() soon (because strsep() is

* reentrant and should be faster). Use only strsep() in new code, please.

** * Sat Feb 09 2002, Jason Thomas ,

* Matthew Hawkins

* – Kissed strtok() goodbye

*/

总结:

strsep返回值为分割后的开始字符串,并将函数的第一个参数指针指向分割后的剩余字符串。它适用于分割关键字在两个字符串之间只严格出现一次的情况。

PS:

因为函数内部会修改原字符串变量,所以传入的参数不能是不可变字符串(即文字常量区)。

如 char *tokenremain =”abcdefghij”//编译时为文字常量,不可修改。

strtok(tokenremain,”cde”);

strsep(&tokenremain,”cde”);

编译通过,运行时会报段错误。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/213431.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • TCP与UCP协议,及socket编程

    TCP与UCP协议,及socket编程

    2021年7月18日
    106
  • 查看是否安装apache_查找手机应用安装位置

    查看是否安装apache_查找手机应用安装位置如果你是问linux自动安装的APACHE的话,直接使用apachectl -v命令,如果告诉你没有这个方法就可以知道系统没有安装apache,如果已经安装了则显示apache的版本,至于安装目录,使用apachectl -c就可以知道了。

    2022年9月21日
    4
  • lea指令!「建议收藏」

    lea指令!「建议收藏」
    最近在看linux-0.11内核,看到lea这个指令,google搜索了一下,转给大家,一起学习@!
     
    先看这个这个语法格式吧:
    对AT&T来说,寻址方式比较怪异,但又非常简洁,语法格式如下:segreg:base_address(offset_address,index,size) ;例子movl%eax,label1(,$2,$4)movl%ebx,(label2,$2,)movl%ecx,(%esp)
    其效果为

    2025年7月27日
    2
  • OpenCV 人脸识别LBPH算法分析

    OpenCV 人脸识别LBPH算法分析一、背景及理论基础人脸识别是指将一个需要识别的人脸和人脸库中的某个人脸对应起来(类似于指纹识别),目的是完成识别功能,该术语需要和人脸检测进行区分,人脸检测是在一张图片中把人脸定位出来,完成的是搜寻的功能。从OpenCV2.4开始,加入了新的类FaceRecognizer,该类用于人脸识别,使用它可以方便地进行相关识别实验。原始的LBP算子定义为在3*3的窗口内,以窗口中心像素为阈值,将相邻的8…

    2022年6月3日
    35
  • pycharm上传文件到服务器_python代码部署到服务器

    pycharm上传文件到服务器_python代码部署到服务器文章目录1.1.

    2022年8月26日
    3
  • 编程是程序设计吗_做软件必须先设计再编程吗

    编程是程序设计吗_做软件必须先设计再编程吗常在电脑前工作,总有那么几天会对未来迷茫,可能是每天静止的坐着,感觉自己在变老,而电脑总想个孩子,每天能冒出无数个想法,让你去琢磨它,跟上它的节奏,真有点TheBigBangTheory的味儿,

    2022年8月6日
    6

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号