Java字符串分割的三种方法

Java字符串分割的三种方法Java中分解字符串

大家好,又见面了,我是你们的朋友全栈君。



一、StringTokenizer方法

Java中substring方法可以分解字符串,返回的是原字符串的一个子字符串。如果要讲一个字符串分解为一个一个的单词或者标记,StringTokenizer可以帮你。

先看个例子:


public static void main(String[] args) {  

StringTokenizer st = new StringTokenizer(“www.ooobj.com”“.b”);  

 while(st.hasMoreElements()){  

System.out.println(“Token:” + st.nextToken());  

 }  

 }  

<span style="font-size:14px;">public static void main(String[] args) {
 StringTokenizer st = new StringTokenizer("www.ooobj.com", ".b");
 while(st.hasMoreElements()){
 System.out.println("Token:" + st.nextToken());
 }
 }
</span>

输出:
Token:www
Token:ooo
Token:j
Token:com

StringTokenizer有两个常用的方法:

1.hasMoreElements()。这个方法和hasMoreElements()方法的用法是一样的,只是StringTokenizer为了实现Enumeration接口而实现的方法,从StringTokenizer的声明可以看到:class StringTokenizer implements Enumeration<Object>。

2.nextElement()。这个方法和nextToken()方法的用法是一样的,返回此 StringTokenizer 的下一个标记。

StringTokenizer的三个构造方法:

1.StringTokenizer(String str)。默认以” \t\n\r\f”(前有一个空格,引号不是)为分割符。
源码:
public StringTokenizer(String str) {

this(str, ” \t\n\r\f”, false);
}

实例:

public static void main(String[] args) {  

 StringTokenizer st = new StringTokenizer(“www ooobj com”);  

 while(st.hasMoreElements()){  

 System.out.println(“Token:” + st.nextToken());  

 }  

 }  

<span style="font-size:14px;">public static void main(String[] args) {
 StringTokenizer st = new StringTokenizer("www ooobj com");
 while(st.hasMoreElements()){
 System.out.println("Token:" + st.nextToken());
 }
 }
</span>

输出:
Token:www
Token:ooobj
Token:com

2.StringTokenizer(String str, String delim)。指定delim为分割符,看第一个例子。

3.StringTokenizer(String str, String delim, boolean returnDelims)。returnDelims为true的话则delim分割符也被视为标记。

实例:

  public static void main(String[] args) { 

  StringTokenizer st = new StringTokenizer(“www.ooobj.com”, “.”, true); 

  while(st.hasMoreElements()){ 

  System.out.println(“Token:” + st.nextToken()); 

  } 

  }

输出:
Token:www
Token:.
Token:ooobj
Token:.
Token:com


二、String.split()方法

在java.lang包中有String.split()方法,返回是一个数组。
 1、“.”和“|”都是转义字符,必须得加”\\”;
  如果用“.”作为分隔的话,必须是如下写法:
String.split(“\\.”),这样才能正确的分隔开,不能用String.split(“.”);
    如果用“|”作为分隔的话,必须是如下写法:
String.split(“\\|”),这样才能正确的分隔开,不能用String.split(“|”);

  2、如果在一个字符串中有多个分隔符,可以用“|”作为连字符,比如:“acount=? and uu =? or n=?”,把三个都分隔出来,可以用
  String.split(“and|or”);

  3、public String[] split(String regex,int limit)根据匹配给定的正则表达式来拆分此字符串。
  此方法返回的数组包含此字符串的每个子字符串,这些子字符串由另一个匹配给定的表达式的子字符串终止或由字符串结束来终止。数组中
  的子字符串按它们在此字符串中的顺序排列。如果表达式不匹配输入的任何部分,则结果数组只具有一个元素,即此字符串。

  4、public string[] split(string regex)
  这里的参数的名称是 regex ,也就是 regular expression (正则表达式)。这个参数并不是一个简单的分割用的字符,而是一个正则表达式,
他对一些特殊的字符可能会出现你预想不到的结果,比如测试下面的代码:

(1) 用竖线 | 分隔字符串,你将得不到预期的结果

String[] aa=“aaa|bbb|ccc”.split(“|”); 
//String[] aa = “aaa|bbb|ccc”.split(“\\|”); 这样才能得到正确的结果 
for(int i=0; i<aa.length; i++){
 
System.out.println(“–“+aa); 
}

(2)用竖 * 分隔字符串运行将抛出java.util.regex.PatternSyntaxException异常,用加号 + 也是如此。

String[] aa=“aaa*bbb*ccc”.split(“*”); 
//String[] aa = “aaa|bbb|ccc”.split(“\\*”); 这样才能得到正确的结果    
for(int i=0; i<aa.length; i++){
 
System.out.println(“–“+aa); 
}

(3)显然,+ * 不是有效的模式匹配规则表达式,用”\\*” “\\+”转义后即可得到正确的结果。 
(4) “|” 分隔串时虽然能够执行,但是却不是预期的目的,”\\|”转义后即可得到正确的结果。 
(5)还有如果想在串中使用””字符,则也需要转义.首先要表达”aaaa\bbbb”这个串就应该用”aaaa\\bbbb”,如果要分隔就应该这样才能得到正确结果: 
String[] aa = “aaa\\bbb\\bccc”.split(\\\\); 
(6) 还有就是点号”.”,也要首先转义才能得到正确的结果。

第一种方法:

string s=“abcdeabcdeabcde”;
string[] sArray=s.Split(‘c’);
foreach(string iin sArray)Console.WriteLine(i.ToString());

输出下面的结果:
 ab
deab
deab
de

第二种方法:
我们看到了结果是以一个指定的字符进行的分割。使用另一种构造方法对多个字符进行分割:

string s=“abcdeabcdeabcde”;
string[] sArray1=s.Split(newchar[3]{
‘c’,‘d’,‘e’});
foreach(string iin sArray1)Console.WriteLine(i.ToString());

可以输出下面的结果:
ab
ab
ab

第三种方法:
除了以上的这两种方法以外,第三种方法是使用正则表达式。新建一个控制台项目。
然后先添加 using System.Text.RegularExpressions;

using System.Text.RegularExpressions
string content=agcsmallmacsmallgggsmallytx;
string[] resultString=Regex.Split(content,small,RegexOptions.IgnoreCase)
foreach(string iin resultString)
     Console.WriteLine(i.ToString());

输出下面的结果:
agc
 mac
 ggg
ytx

第四种方法:

 string str1=“我*****是*****一*****个*****教*****师”;
string[] str2; str1=str1.Replace(“*****”,“*”);
str2=str1.Split(’*‘);foreach(string i in str2)
Console.WriteLine(i.ToString());

第五种方法:
string str1=”我**是*****一*****个*****教*****师“;
我希望显示的结果为:我是一个教师。 我如果采用上面的第四种方法来做就会产生下面的错误:我 是一个教师。中间有空格输出,所以输出结果并不是希望的结果,这就又回到了正则表达式了,这时可以采用下面的第五种方法:

string str1=‘我**是*****一*****个*****教*****师“;
string[] str2=System.Text.RegularExpressions.Regex.Split(str1,@[*]+);
foreach(string iin str2)
Console.WriteLine(i.ToString());

这里通过[*]+ 巧妙的完成了我们的目标。

三、substring方法

java字符串分解 substring用法

单参数形式:
substring(int beginIndex)
该子字符串从beginIndex处的字符开始,直到此字符串末尾。

双参数形式:
substring(int beginIndex, int endIndex)
该子字符串从指定的 beginIndex 处开始,直到索引 endIndex – 1 处的字符。注意:其它一些语言第二个参数往往代表长度,JAVA不一样。该子字符串的长度为 endIndex-beginIndex。

String a = “www.ooobj.com";

03 System.out.println(a);

04 String b = a.substring(2);

05 System.out.println(b);

06 String c = a.substring(1,10);

07 System.out.println(c);

08 String d = a.substring(6, a.length());

 

09 System.out.println(d);

 

输出:

www.ooobj.com
w.ooobj.com
ww.ooobj.
obj.com

注:beginIndex不能为负数,endIndex不能超出字符串长度,否则会抛出StringIndexOutOfBoundsException异常

四,Js的substring()

语法:

程序代码
String.substring(start, end)

说明:
返回一个从start开始到end(不包含end)的子字符串。

示例:

程序代码
var str=”abcdefgh”;
document.write(str.substring(0,1));//return:a
document.write(str.substring(2,5));//return:cde
document.write(str.substring(7,8));//return:h

js的substring()方法与java的比较相似,但js的substring()需要注意一下几点:

1.start不一定就是第一个参数,end也不一定就是第二个参数,substring(3,1)时,开始位置是1,结束位置是3;
2.当要返回的子字符串是从开始位置到结束时,end的值必须大于等于字符串的长度,如上边的str.substring(7,8),按照索引从0开始算的话end的最大值为7,但这边却用8,当然,使用大于8的数返回的结果也是一样的.

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/149591.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • Linux系统开启IPv6任播(anycast)地址[通俗易懂]

    Linux系统开启IPv6任播(anycast)地址[通俗易懂]这两年真是在linux上各种掏捡,各种零碎。。。无力吐槽了。。。下面简单记录一下开启任播地址我的系统是Debian7.21、开启IPv6转发sudoecho1>/proc/sys/net/ipv6/conf/all/forwarding2、完了系统会自动生成IPv6任播地址cat/proc/net/anycast6此时你在网卡上新配置一个IPv6地址,就会在/proc/net/anycast6下生成一个对应的任播地址。在另一台主机上你可以ping6一下其中一个任.

    2022年5月23日
    54
  • ioctl() FIONREAD 检测socket是否有数据可读

    ioctl() FIONREAD 检测socket是否有数据可读先看看FIONREAD的作用FIONREAD:Getthenumberofbytesintheinputbuffer获取接收缓存中数据的字节数项目中用来判断tcpsocket是否有数据接收到,但是出现了一个问题,对于用于accept的socket即调用listen()之后的socket,用FIONREAD,判断的时候报错,ioctl()返回-1,错误码是2…

    2022年7月23日
    6
  • oracle 函数 如何编写

    oracle 函数 如何编写创建函数的基本格式createorreplacefunction函数名称(参数1,参数2)return参数类型iscreateorreplacefunctiongetPreferentialPrice(priceRetinnumber,clientIdinvarchar2,dd_outp_classinvarchar2)returnnumberis…

    2022年7月17日
    14
  • 初识.Net审计

    初识.Net审计前言对.net认知比较少,学习一下.net的一些简单审计。遇到.net源码能简单审审。基础概念文件类型ASPX.cs是页面后的代码,aspx负责显示,服务器端的动作就是在as

    2021年12月13日
    40
  • 计算机技术与阅读,PISA2018阅读素养计算机化自适应测试的技术与方法探析

    计算机技术与阅读,PISA2018阅读素养计算机化自适应测试的技术与方法探析原标题:PISA2018阅读素养计算机化自适应测试的技术与方法探析摘要:PISA2018阅读素养的计算机化自适应测试采用核心阶段、阶段1和阶段2的3阶段自适应测试,题库设定有245道题目,组成45个测试单元,并将其组合成若干题组,用于不同阶段的测试。在路径设计上,为避免位置效应问题,除核心阶段→阶段1→阶段2的标准路径之外,还采用核心阶段→阶段2→阶段1的替代路径。PISA2018阅读素养计算机…

    2022年6月5日
    25
  • java byte数组拷贝_异或校验原理

    java byte数组拷贝_异或校验原理其实在以前没接触这些内容的时候,脸上是懵逼的表情,完全不明白异或是为了干什么。其实用简单的语言来说,接收数据的异或校验相当于解密,发送时候的校验位相当于加密;官方解释是:其他数据信息传递中为保证数据传递正确可靠,在数据帧中常加载异或校验位(个人理解怕传输过程中出现数据丢失损坏的情况,所以加校验保证了数据的准确性)言归正传java中怎么异或校验1、发送数据byte[]rece=newbyte[6];rece[0]=0x55;

    2022年9月28日
    0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号