golang 获取字符串长度的案例

1.不同字符与获取字符串长度

获取字符串长度,是字符串操作的重要方法。理论来说,获取字符串长度,只要从头到尾查找一遍就可以了。但遗憾的是,不同字符具有不同的编码格式。拉丁字母一个字符只要一个字节就行,而中文则可能需要两道三个字节;UNICODE把所有字符设置为2个字节,UTF-8格式则把所有字符设置为1--3个字节。

因此,字符串长度的获得,不等于按字节数查找,而要根据不同字符编码查找。

2.golang中获取字符串长度的方法

对于中文开发者来说,经常需要对字符串进行长度判断。golang有自己的默认判断长度函数len();但遗憾的是,len()函数判断字符串长度的时候,是判断字符的字节数而不是字符长度。因此,在中文字符下,应该采用如下方法:

1)使用 bytes.Count() 统计

2)使用 strings.Count() 统计

3)将字符串转换为 []rune 后调用 len 函数进行统计

4)使用 utf8.RuneCountInString() 统计

3.样例展示

s := "欢迎学习Go的len()函数"
r := []rune(strTest)
fmt.Println(len(r))
fmt.Println(len(s))
fmt.Println(bytes.Count([]byte(s), nil) - 1)
fmt.Println(strings.Count(s, "") - 1)
fmt.Println(utf8.RuneCountInString(s))

补充:Go语言获取中英文混和字符串的长度以及子字符串的方法

1. 纯英文字符串

使用len()函数。

testString1 := "China!"
length1 := len(testString1)
fmt.Printf("testString1 字符串的长度是:%d", length1)

长度是6。

2. 中英文混合字符串

2.1 先使用len()函数。

testString2 := "我爱你中国,我爱你China!"
length2 := len(testString2)
fmt.Printf("字符串的长度是:%d", length2)
fmt.Printf("testString2字符串的长度是:%d\n", length2)
fmt.Printf("testString2中的最后一个字符是:%s\n", testString2[length2-1])
fmt.Printf("testString2中的最后一个字符是:%c\n", testString2[length2-1])
fmt.Printf("testString2中的下标6-末尾的子字符串是:%s\n",testString2[:15])
fmt.Printf("testString2中的下标6-末尾的子字符串是:%s\n",testString2[:16])

这种方法的到的是字节数。Go语言中,中文字符按utf-8编码,占3字节,故长度是31。故此方法不适用统计中英文混合或者中文字符串长度。

2.2 使用utf8.RuneCountInString()方法。

testString2 := "我爱你中国,我爱你China!"
length3 := utf8.RuneCountInString(testString2)
fmt.Printf("使用utf8中的方法统计的字符串长度是:%d\n", length3)

此方法可统计字符数,输出结果是15。

2.3 转成[]rune类型,再对此类型进行操作

testString2 := "我爱你中国,我爱你China!"
temp := []rune(testString2)
length4 := len(temp)
fmt.Printf("使用rune统计的字符串的长度是:%d\n", length4)
//获取字符串中最后一个字符
lastChar := string(temp[length4-1])
//获取下标从0到3(不包括3)的子串
subString1 := temp[0:3]
subString2 := temp[6:9]
fmt.Printf("testString2中的最后一个字符是:%s\n", lastChar)
fmt.Printf("testString2中的下标0-2的子字符串是:%s\n",string(subString1))
fmt.Printf("testString2中的下标6-8的子字符串是:%s\n",string(subString2))

此方法也可输出字符个数15。但是此方法能获取指定下标范围的子字符串,也能获取指定下标位置的字符。比第二种方法方便。

3.示例代码

package main
import (
 "fmt"
 "unicode/utf8"
)
func main() {
 //纯英文
 testString1 := "China!"
 length1 := len(testString1)
 fmt.Printf("testString1字符串的长度是:%d\n", length1)
 lastCharA := testString1[length1-1]
 //此处用%s格式输出最后一个字符会出错,只能用%c
 fmt.Printf("testString1字符串中最后一个字符是:%s\n", lastCharA)
 fmt.Printf("testString1字符串中最后一个字符是:%c\n", lastCharA)
 fmt.Printf("testString1中的下标0-2的子字符串是:%s\n",testString1[0:3])
 fmt.Printf("testString1中的下标3-末尾的子字符串是:%s\n",testString1[3:])
 fmt.Println()
 //中英文加一起15个字符
 testString2 := "我爱你中国,我爱你China!"
 //此处长度是输出字节数,Go语言中文字符是UTF-8编码,长度3字节,故此处应该是15+1+9+6=31
 length2 := len(testString2)
 fmt.Printf("testString2字符串的长度是:%d\n", length2)
 fmt.Printf("testString2中的最后一个字符是:%s\n", testString2[length2-1])
 fmt.Printf("testString2中的最后一个字符是:%c\n", testString2[length2-1])
 fmt.Printf("testString2中的下标6-末尾的子字符串是:%s\n",testString2[:15])
 fmt.Printf("testString2中的下标6-末尾的子字符串是:%s\n",testString2[:16])
 fmt.Println()
 //此处就是统计字符数
 length3 := utf8.RuneCountInString(testString2)
 fmt.Printf("使用utf8中的方法统计的字符串长度是:%d\n", length3)
 fmt.Println()
 //转成rune类型,再统计字符数
 temp := []rune(testString2)
 //获取中英文混合字符串长度
 length4 := len(temp)
 fmt.Printf("使用rune统计的字符串的长度是:%d\n", length4)
 //获取字符串中最后一个字符
 lastCharB := string(temp[length4-1])
 //获取下标从0到3(不包括3)的子串
 subString1 := temp[0:3]
 subString2 := temp[6:]
 fmt.Printf("testString2中的最后一个字符是:%s\n", lastCharB)
 fmt.Printf("testString2中的下标0-2的子字符串是:%s\n",string(subString1))
 fmt.Printf("testString2中的下标6-末尾的子字符串是:%s\n",string(subString2))
}

4. 示例结果

总结

如果是对中英文进行操作,建议用第三种方式。先转成rune[]型,再进行操作。

以上为个人经验,希望能给大家一个参考,也希望大家多多支持我们。如有错误或未考虑完全的地方,望不吝赐教。

(0)

相关推荐

  • Golang中的Unicode与字符串示例详解

    背景: 在我们使用Golang进行开发过程中,总是绕不开对字符或字符串的处理,而在Golang语言中,对字符和字符串的处理方式可能和其他语言不太一样,比如Python或Java类的语言,本篇文章分享一些Golang语言下的Unicode和字符串编码. Go语言字符编码 注意: 在Golang语言中的标识符可以包含 " 任何Unicode编码可以标识的字母字符 ". 被转换的整数值应该可以代表一个有效的 Unicode 代码点,否则转换的结果就将会是 "�",即:一个

  • golang 字符串切片去重实例

    实现目的:实现字符串切片去重,只是两个字符完全相同时,去除一个. 实现方式:考虑两种,一种是常规的双重循环去除,另一种是利用map的key的唯一性实现. 1.通过双重循环来过滤重复元素 方法1, 思路:利用for双重循环,新建一个slice,遍历原slice中的每一个元素,每一次判断这个元素和后面元素是否相同,若相同则去除,若不同则存入新slice中,判断本元素后,再继续判断下一个元素,直到判断完毕. package main import "fmt" func main() { va

  • 利用golang的字符串解决leetcode翻转字符串里的单词

    题目 给定一个字符串,逐个翻转字符串中的每个单词. 示例 1: 输入: "the sky is blue" 输出: "blue is sky the" 示例 2: 输入: " hello world! " 输出: "world! hello" 解释: 输入字符串可以在前面或者后面包含多余的空格,但是反转后的字符不能包括. 示例 3: 输入: "a good example" 输出: "exampl

  • golang时间字符串和时间戳转换的案例

    1. 获取当前时间字符串和时间戳 package main import ( "fmt" "time" ) func main() { now := time.Now().UTC() // 显示时间格式: UnixDate = "Mon Jan _2 15:04:05 MST 2006" fmt.Printf("%s\n", now.Format(time.UnixDate)) // 显示时间戳 fmt.Printf(&quo

  • golang 字符串拼接性能的对比分析

    背景 最近在做一个服务发现/注册的agent, 各个服务需要通过这个agent来注册自己的服务,在完成 开发后,测试性能时发现性能达不到要求,通过pprof 来确认cpu主要耗费在gc上,分析结果主要是由于字符串拼接导致,故需要测试一下字符串拼接的几种方法的性能: 字符串拼接的几种方法 1.直接使用加号进行拼接 2.strings.Join() 3.fmt.Sprintf() 4.bytes.Buffer 大量字符串拼接性能测试 我们使用的场景主要是大量字符串拼接,所以需要的场景是不断在字符串上

  • golang 获取字符串长度的案例

    1.不同字符与获取字符串长度 获取字符串长度,是字符串操作的重要方法.理论来说,获取字符串长度,只要从头到尾查找一遍就可以了.但遗憾的是,不同字符具有不同的编码格式.拉丁字母一个字符只要一个字节就行,而中文则可能需要两道三个字节:UNICODE把所有字符设置为2个字节,UTF-8格式则把所有字符设置为1--3个字节. 因此,字符串长度的获得,不等于按字节数查找,而要根据不同字符编码查找. 2.golang中获取字符串长度的方法 对于中文开发者来说,经常需要对字符串进行长度判断.golang有自己

  • mysql获取字符串长度函数(CHAR_LENGTH)

    length:   是计算字段的长度一个汉字是算三个字符,一个数字或字母算一个字符CHAR_LENGTH(str) 返回值为字符串str 的长度,长度的单位为字符.一个多字节字符算作一个单字符.对于一个包含五个二字节字符集, LENGTH()返回值为 10,而CHAR_LENGTH()的返回值为5.CHARACTER_LENGTH(str) CHARACTER_LENGTH()是CHAR_LENGTH()的同义词.BIT_LENGTH(str) 返回2进制长度.例如:可以查出用户名长度少于6个字

  • Shell获取字符串长度的多种方法总结

    前言 我们在日常工作中,对于求字符串操作在shell脚本中很常用,实现的方法有很多种,下面就来给大家归纳.汇总了求字符串的几种可能方法,话不多说了,来一起看看详细的介绍吧. 方法如下: [方法一]:利用${#str}来获取字符串的长度 [方法二]:利用awk的length方法 备注: 1) 最好用{}来放置变量 2) 也可以用length($0)来统计文件中每行的长度 [方法三]:利用awk的NF项来获取字符串长度 备注: -F为分隔符,NF为域的个数,即单行字符串的长度 [方法四]:利用wc的

  • C++获取字符串长度的几个函数方式

    C/C++ strlen(str).str.length().str.size().sizeof(str)都可以求字符串长度. 其中str.length().str.size().sizeof(str)是用于求string类对象的成员函数 strlen(str)是用于求字符数组的长度,其参数是char*. 补充知识:获取字符串长度的函数sizeof().strlen().length().size()详解和区别 在C++中计算长度的函数有四种,它们分别是sizeof() ,size(),strl

  • C语言多种获取字符串长度的方法

    在C语言中,想要获取字符串长度可以有很多方法,下面分别介绍 一.使用sizeof()运算符 在C语言中,sizeof() 是长度的运算符,括号中可以放入数据类型或者表达式,一般我们用来计算字符串长度. 基本用法: int i=10; sizeof(i);//表达式 char str[]="hello world"; sizeof(str); sizeof(double);//数据类型 在使用sizeof()求字符串长度时,会将 '\0' 也计算到字符串长度中.例如"abcd&

  • PowerShell获取字符串长度的方法

    使用PowerShell可以很方便的计算字符串的长度.PowerShell是继承于Microsoft .NET Framework的,所以在.NET里面怎么获取到字符串的长度,在PowerShell中可以使用相同的方法. 我们知道在.NET中,可以使用String.Length方法来获取字符串的长度,让我们看看PowerShell中怎么样依葫芦画瓢. 复制代码 代码如下: $string = "1234567"; Write-Host $string.Length; #输出为7 如果你

  • PHP获取中英混合字符串长度的方法

    今晚在写框架的表单验证类时,需要判断某个字符串长度是否在指定区间内,很自然地,想到了PHP中的strlen函数. 复制代码 代码如下: $str = 'Hello world!';echo strlen($str); // 输出12 然而在PHP自带的函数中,strlen及mb_strlen都是通过计算字符串所占字节数来计算长度的,在不同的编码情况下,中文所占的字节数是不同的.在GBK/GB2312下,中文字符占2个字节,而在UTF-8下,中文字符占3个字节. 复制代码 代码如下: $str =

  • JS判断输入字符串长度实例代码(汉字算两个字符,字母数字算一个)

    js判断输入字符串长度实例代码(汉字算两个字符,字母数字算一个) 文本输入时,由于数据库表字段长度限制会导致提交失败,因此想到了此方法验证. 废话不多说上代码: <html> <head> <title>js判断输入字符串长度(汉字算两个字符,字母数字算一个)</title> <style type="text/css"> .pbt { margin-bottom: 10px; } .ie6 .pbt .ftid a, .ie

  • js如何判断输入字符串长度

    js判断输入字符串长度(汉字算两个字符,字母数字算一个) 文本输入时,由于数据库表字段长度限制会导致提交失败,因此想到了此方法验证. 废话不多说上代码: <html> <head> <title>js判断输入字符串长度(汉字算两个字符,字母数字算一个)</title> <style type="text/css"> .pbt { margin-bottom: 10px; } .ie6 .pbt .ftid a, .ie7 .p

  • Shell脚本中计算字符串长度的5种方法

    有时在Linux操作系统中需要计算某个字符串的长度,通过查询资料整理了下目前Shell中获取字符串的长度的多种方法,在这里分享给大家,方法如下: 方法1: 使用wc -L命令 wc -L可以获取到当前行的长度,因此对于单独行的字符串可以用这个简单的方法获取,另外wc -l则是获取当前字符串内容的行数. 复制代码 代码如下: echo "abc" |wc -L 方法2: expr length string 使用expr length可以获取string的长度 方法3: awk获取域的个

随机推荐