我使用 jena 从 dbpedia 获得了一些数据,并且由于 jena 的输出基于 xml,因此在某些情况下需要对 xml 字符进行不同的处理,如下所示:
Guns n ' Roses
我只是想知道这是什么类型的econding? 我想在 javascript 的帮助下根据上面的encode(r) 对我的输入进行解码/编码,并将其发送回 servlet。
(编辑后的帖子,如果您删除 & 和 amp 之间的空格,您将获得正确的字符,因为在 stackoverflow 中我找不到一种方法来做到这一点,我决定这样写!)
最佳答案
似乎是 XML 实体编码,以及一个数字字符引用(十进制)。
A numeric character reference refers to a character by its Universal Character Set/Unicode code point, and uses the format
您可以在这里获取一些信息:List of XML and HTML character entity references on Wikipedia .
您的 Angular 色编号为 39,即撇号:'
,也可以通过 Angular 色实体引用来引用:'
。
要使用 Javascript 对其进行解码,您可以使用例如 php.js
,其中有 html_entity_decode()
函数(请注意,它取决于 get_html_translation_table() )。
更新:回复您的编辑:基本上是相同的,唯一的区别是它被编码了两次(可能是错误的)。 &
是与号:&
。
关于javascript - 这是什么类型的编码?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10465714/