我正在尝试从 Golang 中的字符串中删除不可打印的字符。
https://play.golang.org/p/Touihf5-hGH
invisibleChars := "Douglas"
fmt.Println(invisibleChars)
fmt.Println(len(invisibleChars))
normal := "Douglas"
fmt.Println(normal)
fmt.Println(len(normal))
输出:
Douglas
10
Douglas
7
第一个字符串末尾有一个不可见的字符。
我尝试替换非 ASCII 字符,但它也删除了重音符号。
如何仅删除不可打印的字符?
最佳答案
前言:我在我的 github.com/icza/gox
中发布了这个实用程序图书馆,见 stringsx.Clean()
.
您可以删除 unicode.IsGraphic()
的 rune 。或 unicode.IsPrint()
报告虚假。删除某些 rune
s 来自一个字符串,你可以使用 strings.Map()
.
例如:
invisibleChars := "Douglas"
fmt.Printf("%q\n", invisibleChars)
fmt.Println(len(invisibleChars))
clean := strings.Map(func(r rune) rune {
if unicode.IsGraphic(r) {
return r
}
return -1
}, invisibleChars)
fmt.Printf("%q\n", clean)
fmt.Println(len(clean))
clean = strings.Map(func(r rune) rune {
if unicode.IsPrint(r) {
return r
}
return -1
}, invisibleChars)
fmt.Printf("%q\n", clean)
fmt.Println(len(clean))
此输出(在 Go Playground 上尝试):
"Douglas\u200b"
10
"Douglas"
7
"Douglas"
7
关于string - 如何删除不可打印的字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63989822/