text - 如何在文本编辑器中找到特殊字符的字符代码?

标签 text utf-8 character-encoding textmate sublimetext2

将来自外部来源的文本粘贴到纯文本编辑器(例如 TextMate 或 Sublime Text 2)时,一个常见问题是通常也会粘贴特殊字符。其中一些字符呈现良好,但取决于来源,有些可能无法正确显示(通常显示为带有框的问号)。

所以这实际上是两个问题:

  • 给定一个特殊字符(例如,' 或 ♥),我能否确定用于从我的文本编辑器中显示该字符的 UTF-8 字符代码,和/或将这些字符转换为其字符代码?
  • 对于那些作为垃圾进来的“额外特殊”字符,有没有办法弄清楚在源文本中使用什么编码来显示该字符,并且这些字符是否可以以某种方式转换为 UTF-8?
  • 最佳答案

    我最喜欢的查找字符的网站是 fileformat.info .他们有一个很棒的 Unicode 字符搜索,其中包括许多关于每个字符及其各种编码的有用信息。

    如果您看到带框的问号,则表示您粘贴了无法解释的内容,通常是因为它不是合法的 UTF-8(并非每个字节序列都是合法的 UTF-8)。一种可能性是它是 UTF-16,具有您的编辑器不期望的字节序模式。如果您可以将完整的原始源文件放入文件中,file命令通常是确定编码的最佳工具。

    关于text - 如何在文本编辑器中找到特殊字符的字符代码?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13123261/

    相关文章:

    regex - 将字符串保留到 R 中模式第一次出现的位置

    Android:文本缩放到最大可能而不换行

    c++ - std::string 在安全位置截断 utf-8 的最佳方式

    mysql - latin-1 到 utf-8 数据库

    maven - 激活资源过滤后编码错误

    javascript - 使用 for 循环连接对象文本值 - Javascript

    image - 如何防止文本在图形和表格之间爬行

    java - 表情符号没有为输出编写器正确编码

    java - 如何将代码点 80 处的字符写入 Windows-1252 中的文件?

    使用 libiconv 将 UTF-16 转换为 UTF-8