如何从字符串中删除奇怪和不需要的 Unicode 字符(例如带问号的黑色菱形)?
更新:
请告诉我“带问号的黑菱形”对应的Unicode字符串或正则表达式。
最佳答案
带有问号的黑色菱形不是 Unicode 字符——它是您的字体无法显示的字符的占位符。如果字符串中存在的字形不在您用来显示该字符串的字体中,您将看到占位符。这被定义为 U+FFFD: �。它的外观因您使用的字体而异。
您可以使用 java.text.normalizer
删除不在“正常”ASCII 字符集中的 Unicode 字符。
关于Java - 从字符串中删除奇怪的字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5462693/