string - 如何删除不可打印的字符

标签 string go unicode utf-8

我正在尝试从 Golang 中的字符串中删除不可打印的字符。

https://play.golang.org/p/Touihf5-hGH

invisibleChars := "Douglas​"
fmt.Println(invisibleChars)
fmt.Println(len(invisibleChars))

normal := "Douglas"
fmt.Println(normal)
fmt.Println(len(normal))

输出:
Douglas​
10
Douglas
7

第一个字符串末尾有一个不可见的字符。

我尝试替换非 ASCII 字符,但它也删除了重音符号。

如何仅删除不可打印的字符?

最佳答案

前言:我在我的 github.com/icza/gox 中发布了这个实用程序图书馆,见 stringsx.Clean() .

您可以删除 unicode.IsGraphic() 的 rune 。或 unicode.IsPrint() 报告虚假。删除某些 rune s 来自一个字符串,你可以使用 strings.Map() .

例如:

invisibleChars := "Douglas​"
fmt.Printf("%q\n", invisibleChars)
fmt.Println(len(invisibleChars))

clean := strings.Map(func(r rune) rune {
    if unicode.IsGraphic(r) {
        return r
    }
    return -1
}, invisibleChars)

fmt.Printf("%q\n", clean)
fmt.Println(len(clean))

clean = strings.Map(func(r rune) rune {
    if unicode.IsPrint(r) {
        return r
    }
    return -1
}, invisibleChars)

fmt.Printf("%q\n", clean)
fmt.Println(len(clean))

此输出(在 Go Playground 上尝试):
"Douglas\u200b"
10
"Douglas"
7
"Douglas"
7

关于string - 如何删除不可打印的字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63989822/

相关文章:

ios - Swift 获取字符串中两个字符串之间的字符串

由golang服务器提供服务时html视频标签不播放m3u8文件

c - 获取要从字符串中打印的符号数

c++ - std::string::substr 抛出 std::out_of_range 但参数在限制范围内

c++ - 如何将字符串中的所有数字一一读入数组(c++)

go - go.mod上的严格版本

http - GO 结构文字中的未知 http.Transport 字段 'ExpectContinueTimeout'

Perl 下拉菜单和 Unicode

java - Windows 控制台中的 unicode 字符比预期的多

c - 如何在 C 中定义/使用 2 维字符串数组(3 维字符?)?