sed - 使用sed从文件中删除多字节字符

标签 sed multibyte

我需要从文件中删除所有多字节字符，我不知道它们是什么，所以我需要覆盖整个范围。

我可以像这样使用 grep 找到它们:
grep -P "[\x80-\xFF]"'我的文件'

试图用 sed 做一个类似的事情，但删除它们。

干杯

最佳答案

试试这个:

LANG=C sed 's/[\x80-\xFF]//g' filename

关于sed - 使用sed从文件中删除多字节字符，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/3521106/

上一篇：twitter-bootstrap - 带有 Angular 指令的可点击 bootstrap-datepicker 图标

下一篇：ruby-on-rails - 使用 Ruby on Rails 进行 Windows 身份验证

相关文章：

正则表达式贪婪 : shrinking long path

php - 如何使 PHP like_text() 函数适用于日语字符(汉字、片假名和平假名)？

linux - fedora sed命令替换特殊字符

regex - 在 unix 中提取特定出现的引号之间的字符串

PHP - 为所有支持的语言替换所有非字母数字字符

c - 使用 printf 打印 UTF-8 字符串 - 宽字符串文字与多字节字符串文字

java - .substring() 在 Unix/Linux 上处理 Java 中的多字节字符时

java - 在 JAVA 中向文件写入/读取可变字节编码字符串表示形式

shell - Unix 剪切 : Print same Field twice

linux - 将捕获的组作为数组索引发送到 sed

©2024 IT工具网联系我们