这是一个有点傻的问题,但我今天偶然发现了这个奇怪的“字符”ı̸̸̸̸̸̸̸̸̸̸̸̸̸̸̸̸̸̸̨̨̨̨̨̨̨̨尝试在文本编辑器中复制它,你会发现你必须按几次退格键才能删除它 => I假设实际上有几个角色,但我不知道如何进一步分析。
有什么想法吗?
谢谢
最佳答案
使用十六进制编辑器查看原始字符数据。您的示例包含三个具有特殊含义的多字节字符。给你:
̸
U+0338 COMBINING LONG SOLIDUS OVERLAY
General Character Properties
In Unicode since: 1.1
Unicode category: Mark, Non-Spacing
Various Useful Representations
UTF-8: 0xCC 0xB8
UTF-16: 0x0338
C octal escaped UTF-8: \314\270
XML decimal entity: ̸
Annotations and Cross References
Alias names:
• long slash overlay
----------------------
̨
U+0328 COMBINING OGONEK
General Character Properties
In Unicode since: 1.1
Unicode category: Mark, Non-Spacing
Various Useful Representations
UTF-8: 0xCC 0xA8
UTF-16: 0x0328
C octal escaped UTF-8: \314\250
XML decimal entity: ̨
Annotations and Cross References
Alias names:
• nasal hook
Notes:
• Americanist: nasalization
• Polish, Lithuanian
See also:
• U+02DB OGONEK
----------------------
ı
U+0131 LATIN SMALL LETTER DOTLESS I
General Character Properties
In Unicode since: 1.1
Unicode category: Letter, Lowercase
Various Useful Representations
UTF-8: 0xC4 0xB1
UTF-16: 0x0131
C octal escaped UTF-8: \304\261
XML decimal entity: ı
Annotations and Cross References
Notes:
• Turkish, Azerbaijani
• uppercase is U+0049 LATIN CAPITAL LETTER I
See also:
• U+0069 LATIN SMALL LETTER I
我使用十六进制编辑器和用于显示字符映射表的程序发现了这一点。也许你可以自己做。前两个是覆盖字符,这就是为什么您必须多次按退格键(它们不会在文本中生成空格;它们会修改前一个字符的外观)。
文本中的人物正在做什么,这里没有人可以告诉你。你必须自己找出来。 (也许文本文件中的随机二进制数据?)
关于character-encoding - 未知字符 ı̸̸̸̸̸̸̸̸̸̸̸̸̸̸̸̸̸̸̨̨̨̨̨̨̨̨,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7599219/