比如新浪微博发微博的输入框有一个已输入字数的统计,它的规则推测是:汉字和中文标点算 1 个字数,英文和其他符号算 0.5 个字数。不足 1 个字算 1 个。大家可以去微博体验一下计算方式。
golang 可以使用正则和 unicode 包的方法判断。
以下函数 GetStrLength 返回输入的字符串的字数,每个汉字和中文标点算 1 个字数,英文和其他字符算半个字数,不足 1 个字算 1 个。
1
2
3
4
5
6
7
8
9
10
11
12
13
|
// GetStrLength 返回输入的字符串的字数,汉字和中文标点算 1 个字数,英文和其他字符 2 个算 1 个字数,不足 1 个算 1个 func GetStrLength(str string) float64 { var total float64 reg := regexp.MustCompile("/·|,|。|《|》|‘|'|”|“|;|:|【|】|?|(|)|、/") for _, r := range str { if unicode.Is(unicode.Scripts["Han"], r) || reg.Match([]byte(string(r))) { total = total + 1 } else { total = total + 0.5 } } return math.Ceil(total) } |
1:获取字符串字节的个数,并按字节挨个输出
1
2
3
4
5
6
7
8
9
10
11
12
13
14
|
package main import ( "fmt" ) func main() { var str string = "abc郑闯" //共9个字节 charray := []byte(str) //转换为byte:一个字节对应一个数组元素 fmt.Println(len(charray)) //获取元素的个数,结果为9 for _, v := range charray { fmt.Printf("%c", v) //输出结果为:abcéé¯ } } |
输出:
9
abcéé¯
2:获取字符串元素的个数,并按元素挨个输出
1
2
3
4
5
6
7
8
9
10
11
12
13
|
package main import ( "fmt" ) func main() { a := "I love my family!我爱我的家人!" b := []rune(a) //转换为rune:一个字符对应一个元素 (共24个) fmt.Println(len(b)) //获取元素的个数(24) for _, v2 := range b { fmt.Printf("%c", v2) //输出结果:I love my family!我爱我的家人! } } |
输出:
24
I love my family!我爱我的家人!
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持服务器之家。
原文链接:https://blog.tanteng.me/2018/05/golang-str-length