sed - 使用sed从文件中删除多字节字符

标签 sed multibyte

我需要从文件中删除所有多字节字符,我不知道它们是什么,所以我需要覆盖整个范围。

我可以像这样使用 grep 找到它们:
grep -P "[\x80-\xFF]"'我的文件'

试图用 sed 做一个类似的事情,但删除它们。

干杯

最佳答案

试试这个:

LANG=C sed 's/[\x80-\xFF]//g' filename

关于sed - 使用sed从文件中删除多字节字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3521106/

相关文章:

正则表达式贪婪 : shrinking long path

php - 如何使 PHP like_text() 函数适用于日语字符(汉字、片假名和平假名)?

linux - fedora sed命令替换特殊字符

regex - 在 unix 中提取特定出现的引号之间的字符串

PHP - 为所有支持的语言替换所有非字母数字字符

c - 使用 printf 打印 UTF-8 字符串 - 宽字符串文字与多字节字符串文字

java - .substring() 在 Unix/Linux 上处理 Java 中的多字节字符时

java - 在 JAVA 中向文件写入/读取可变字节编码字符串表示形式

shell - Unix 剪切 : Print same Field twice

linux - 将捕获的组作为数组索引发送到 sed