我的网站上有一些文档,用户可以通过富文本编辑器编辑这些文档,然后将它们保存(到数据库)并打印出来。一些用户遇到了一些角色被搞砸的问题(只发生在现场)。我查过数据库,有趣的角色在数据库中,所以这不是显示问题。这要么发生在他们保存文档(在网站上提交表格)时,要么他们在其中放置了一些奇怪的东西,要么他们的浏览器更改了一些字符。
不断出现在各处的字符是 。它是一个带重音符号的 A,后跟一个空格。查看源 HTML,似乎受影响的文档的所有
都已转换。但每当我尝试时,结果都很好。
什么会导致
变成 unicode 字符,但仅在有限的情况下?
最佳答案
将 UTF-8 编码误解为 Latin-1 会导致这种情况。
>>> u'\xa0'.encode('utf-8').decode('latin-1')
u'\xc2\xa0'
>>> print u'\xa0*'.encode('utf-8').decode('latin-1')
 *
关于php - 什么会导致 变成 unicode 字符?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9220831/