首先说一下go中的字符串类型:
创新互联主要从事成都网站设计、做网站、网页设计、企业做网站、公司建网站等业务。立足成都服务皮山,十多年网站建设经验,价格优惠、服务专业,欢迎来电咨询建站服务:13518219792
字符串就是一串固定长度的字符连接起来的字符序列。Go的字符串是由单个字节连接起来的。Go语言的字符串的字节使用UTF-8编码标识Unicode文本。
下面介绍字符串的三种遍历方式,根据实际情况选择即可。
该遍历方式==缺点==:遍历是按照字节遍历,因此如果有中文等非英文字符,就会出现乱码,比如要遍历"abc北京"这个字符串,效果如下:
可见这不是我们想要的效果,根据utf-8中文编码规则,我们要str[3]str[4]str[5]三个字节合起来组成“北”字及 str[6]str[7]str[8]合起来组成“京”字。由此引出下面第二种遍历方法。
该方式是按照字符遍历的,所以不会出现乱码,如下:
运行结果:
从图中可以看到第二个汉子“京”的开始下标是6,直接跳过了4和5,可见确实依照utf8编码方式将三个字节组合成了一个汉字,str[3]-str[5]组合成“北”字,str[6]-str[8]组合成了“京”字。
由于下标的不确定性,所以引出了下面的遍历方式。
1 可以先将字符串转成 []rune 切片
2 再用常规方法进行遍历
运行效果:
由此可见下标是按1递增的,没有产生跳跃现象。
String s = "afhakhfakshfka_key_adasfasfa" 目标字符串,KEY就用"key"
int index = s.indexOf("key") 获取出现key字符串的第一度个知位置,这里要保证前面没有跟KEY重复
String left = s.substring(index) 截取KEY出现位道置前面的字回符串
String right = s.sbustring(index+3) 后面的字符串, +3 是key的长度答为3 (KEY的值长度)
String[] strs = str.split(Pattern.quote("指定的字符"));
var str = 'abcd';
str.substr(0, str.indexOf('b') + 1);
"ab"
var str = 'abcd';
str.substr(str.indexOf('b') + 1);
"cd"
扩展资料:
字符串或串(String)是由数字、字母、下划线组成的一串字符。一般记为 s=“a1a2···an”(n=0)。它是编程语言中表示文本的数据类型。在程序设计中,字符串(string)为符号或数值的一个连续序列,如符号串(一串字符)或二进制数字串(一串二进制数字)。
通常以串的整体作为操作对象,如:在串中查找某个子串、求取一个子串、在串的某个位置上插入一个子串以及删除一个子串等。两个字符串相等的充要条件是:长度相等,并且各个对应位置上的字符都相等。设p、q是两个串,求q在p中首次出现的位置的运算叫做模式匹配。串的两种最基本的存储方式是顺序存储方式和链接存储方式。
参考资料来源:百度百科-字符串
先来看一个简单的例子
输出的结果为:
从上面例子中可以看出,string是以byte数组形式存储的,而一个utf8格式的中文占3个byte.要得到正确的中文字符的长度和分割,可以使用 rune 数组来拆分. rune类型是int32的别名,一个rune可以表示一个中文字符,go也提供了rune数组自动拆分string中文字符的方法 rt := []rune(str) .
我们再把上面例子修改一下:
得到的输出结果为:
这样就能比较好的处理中文了,而且不会出现乱码的情况.
方法:
先拆分,然后把拆分的字符串存到数据组中即可,代码参考
public class STest
{
public static void main(String[] args)
{
String t="abc,edf,xyz";
String[] chrstr=t.split(",");
for(int i=0;ichrstr.length;i++)
{
System.out.println(chrstr[i]);
}
}
}