我正在尝试修复一个奇怪的角色错误,但我不知道发生了什么。我有一篇外国人写的文章,当我收到它时,字体渲染正确出现了奇怪的问题。我已将其范围缩小到所使用的字符集问题,但我不知道如何将其转换为正确的美国版本或诸如此类的问题。帮忙?
这是一个例子:
企业网站
这显然是短语“商业网站”,但是当你cmd+f或cntrl+f并输入该短语时,它不会将其识别为该短语。有人经历过这个问题吗?我发现的唯一解决方法是重新输入该短语,但这对于 1500 字的文章来说是不可行的。我尝试将其复制并粘贴到文本编辑器中以对其进行重新编码,但这没有奏效。
最佳答案
我从该页面复制了文本,并将其放入此 JavaScript 中:
'巴士网站'.split('').map(c => c.charCodeAt(0).toString(16))
输出为:
["62"、"75"、"455"、"456"、"6e"、"435"、"455"、"455"、"20"、"77"、"435"、“62”、“455”、“456”、“74”、“435”]
其中一些在 ASCII 范围内,但很多都是来自西里尔字母的相似字符。
关于javascript - 这是奇怪的外来字符集还是编码问题?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57856233/