javascript - 这是奇怪的外来字符集还是编码问题?

标签 javascript html encoding utf-8 character

我正在尝试修复一个奇怪的角色错误,但我不知道发生了什么。我有一篇外国人写的文章,当我收到它时,字体渲染正确出现了奇怪的问题。我已将其范围缩小到所使用的字符集问题,但我不知道如何将其转换为正确的美国版本或诸如此类的问题。帮忙?

这是一个例子:

企业网站

这显然是短语“商业网站”,但是当你cmd+f或cntrl+f并输入该短语时,它不会将其识别为该短语。有人经历过这个问题吗?我发现的唯一解决方法是重新输入该短语,但这对于 1500 字的文章来说是不可行的。我尝试将其复制并粘贴到文本编辑器中以对其进行重新编码,但这没有奏效。

最佳答案

我从该页面复制了文本,并将其放入此 JavaScript 中:

'巴士网站'.split('').map(c => c.charCodeAt(0).toString(16))

输出为:

["62"、"75"、"455"、"456"、"6e"、"435"、"455"、"455"、"20"、"77"、"435"、“62”、“455”、“456”、“74”、“435”]

其中一些在 ASCII 范围内,但很多都是来自西里尔字母的相似字符。

关于javascript - 这是奇怪的外来字符集还是编码问题?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57856233/

相关文章:

Javascript 和 C# Unicode 反/编码结果相同

javascript - 样式组件内的动态最小最大值

javascript - Chrome : Uncaught Error: can't load XRegExp twice in the same frame

Javascript + jQuery,单击处理程序返回 false 以阻止浏览器访问链接

html - 将 h1 置于标题中心?

java - 如何将阿拉伯语单词保存到oracle数据库中?

javascript - 将变量从 .js 传递到 PHP,然后接收新的 var 作为响应?

javascript - 调整浏览器大小后,麦哲伦基金会开始太早或太晚地坚持

html - 主页 CSS 文件未正确链接与 HTML 等效文件

r - 带有 <U+0092> Unicode 字符的字符串出现问题