text - 如何在文本编辑器中找到特殊字符的字符代码？

标签 text utf-8 character-encoding textmate sublimetext2

将来自外部来源的文本粘贴到纯文本编辑器(例如 TextMate 或 Sublime Text 2)时，一个常见问题是通常也会粘贴特殊字符。其中一些字符呈现良好，但取决于来源，有些可能无法正确显示(通常显示为带有框的问号)。

所以这实际上是两个问题:

给定一个特殊字符(例如，' 或 ♥)，我能否确定用于从我的文本编辑器中显示该字符的 UTF-8 字符代码，和/或将这些字符转换为其字符代码？

对于那些作为垃圾进来的“额外特殊”字符，有没有办法弄清楚在源文本中使用什么编码来显示该字符，并且这些字符是否可以以某种方式转换为 UTF-8？

最佳答案

我最喜欢的查找字符的网站是 fileformat.info .他们有一个很棒的 Unicode 字符搜索，其中包括许多关于每个字符及其各种编码的有用信息。

如果您看到带框的问号，则表示您粘贴了无法解释的内容，通常是因为它不是合法的 UTF-8(并非每个字节序列都是合法的 UTF-8)。一种可能性是它是 UTF-16，具有您的编辑器不期望的字节序模式。如果您可以将完整的原始源文件放入文件中，file命令通常是确定编码的最佳工具。

关于text - 如何在文本编辑器中找到特殊字符的字符代码？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/13123261/

上一篇：powershell - Powershell v4 和 v5 之间 Join-Path cmdlet 的行为

下一篇：netbeans - 如何快速取消缩进代码块？

相关文章：

regex - 将字符串保留到 R 中模式第一次出现的位置

Android:文本缩放到最大可能而不换行

c++ - std::string 在安全位置截断 utf-8 的最佳方式

mysql - latin-1 到 utf-8 数据库

maven - 激活资源过滤后编码错误

javascript - 使用 for 循环连接对象文本值 - Javascript

image - 如何防止文本在图形和表格之间爬行

java - 表情符号没有为输出编写器正确编码

java - 如何将代码点 80 处的字符写入 Windows-1252 中的文件？

使用 libiconv 将 UTF-16 转换为 UTF-8