character-encoding - 未知字符 ı̸̸̸̸̸̸̸̸̸̸̸̸̸̸̸̸̸̸̨̨̨̨̨̨̨̨

标签 character-encoding fonts

这是一个有点傻的问题,但我今天偶然发现了这个奇怪的“字符”ı̸̸̸̸̸̸̸̸̸̸̸̸̸̸̸̸̸̸̨̨̨̨̨̨̨̨尝试在文本编辑器中复制它,你会发现你必须按几次退格键才能删除它 => I假设实际上有几个角色,但我不知道如何进一步分析。

有什么想法吗?

谢谢

最佳答案

使用十六进制编辑器查看原始字符数据。您的示例包含三个具有特殊含义的多字节字符。给你:

 ‍̸

U+0338 COMBINING LONG SOLIDUS OVERLAY

General Character Properties

In Unicode since: 1.1
Unicode category: Mark, Non-Spacing

Various Useful Representations

UTF-8: 0xCC 0xB8
UTF-16: 0x0338

C octal escaped UTF-8: \314\270
XML decimal entity: ̸

Annotations and Cross References

Alias names:
 • long slash overlay

----------------------

‍̨

U+0328 COMBINING OGONEK

General Character Properties

In Unicode since: 1.1
Unicode category: Mark, Non-Spacing

Various Useful Representations

UTF-8: 0xCC 0xA8
UTF-16: 0x0328

C octal escaped UTF-8: \314\250
XML decimal entity: ̨

Annotations and Cross References

Alias names:
 • nasal hook

Notes:
 • Americanist: nasalization
 • Polish, Lithuanian

See also:
 • U+02DB OGONEK

----------------------

ı

U+0131 LATIN SMALL LETTER DOTLESS I

General Character Properties

In Unicode since: 1.1
Unicode category: Letter, Lowercase

Various Useful Representations

UTF-8: 0xC4 0xB1
UTF-16: 0x0131

C octal escaped UTF-8: \304\261
XML decimal entity: ı

Annotations and Cross References

Notes:
 • Turkish, Azerbaijani
 • uppercase is U+0049 LATIN CAPITAL LETTER I

See also:
 • U+0069 LATIN SMALL LETTER I

我使用十六进制编辑器和用于显示字符映射表的程序发现了这一点。也许你可以自己做。前两个是覆盖字符,这就是为什么您必须多次按退格键(它们不会在文本中生成空格;它们会修改前一个字符的外观)。

文本中的人物正在做什么,这里没有人可以告诉你。你必须自己找出来。 (也许文本文件中的随机二进制数据?)

关于character-encoding - 未知字符 ı̸̸̸̸̸̸̸̸̸̸̸̸̸̸̸̸̸̸̨̨̨̨̨̨̨̨,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7599219/

相关文章:

elasticsearch - Log4j2编码问题

character-encoding - 如何将 8 位字节转换为 6 位字符?

使用 Eclipse 和 Maven 进行 Java 编码

emacs - 在 emacs (centos) 中使用 Inconsolata 字体

asp.net - 多行文本框的默认字体与单行文本框不同?

html - 如何在 <select> 标签中呈现自定义字体?

php - 获取没有标题/编码的外部网页的html源

javascript - TextEncoder 和 TextDecoder 不是彼此的完美逆向

css - IE11 中的@import 问题

html - 字体无法在 chrome 中正确显示