我的计算机上的应用程序需要读入文本文件。我有好几个,其中一个不起作用;该程序无法读取它并告诉我其中某个地方有一个坏字符。我的第一个猜测是那里有一个非 ASCII 字符,但我不知道如何找到它。 Perl 或任何通用正则表达式都会很好。有什么想法吗?
最佳答案
您可以使用[^\x20-\x7E]
来匹配非ASCII字符。
例如grep -P '[^\x20-\x7E]'可疑文件
关于regex - 搜索非 ASCII 文档,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8845349/