我想知道在 Haskell 中处理 Unicode XML 的官方解决方案是什么。
我注意到 HXT 对文本使用简单的 String
表示(Unicode 字符列表!!!)。
Constructors
XText String ordinary text (leaf)
XBlob Blob text represented more space efficient as bytestring (leaf)
解析时如何在这两种表示之间进行选择?强制用户使用字符列表听起来并不是一个特别有吸引力的功能,尤其是当 XML 文档包含大量文本内容时。
另外,我找到了http://hackage.haskell.org/package/hxt-unicode在谷歌上,但我不确定它是如何与解析一起使用的。过去对 Unicode 的支持也更加明确:http://hackage.haskell.org/packages/archive/hxt/8.5.2/doc/html/Text-XML-HXT-DOM-Unicode.html 但此模块已在最新版本(撰写本文时为 9.3.1.0)中删除,原因不明。这背后的动机是什么?
有人可以提供一些示例代码,也请说明如何使用 HXT 吗?维基页面在这方面严重缺乏。谢谢。
最佳答案
xml-conduit包使用 Text
数据类型来存储文本数据。在过去几年中,它已成为标准的文本数据表示形式。 xml-conduit 是一个维护良好的包,我个人将它用于大量的开源代码和商业代码。
关于xml - Haskell 对 XML 中的 Unicode 的态度是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12750418/