xml - 在 lisp 程序中删除标签

标签 xml tags lisp

我需要一些编程方面的帮助。我正在使用 Common Lisp 进行编码,并且正在尝试从字符串列表中删除标签。我读入了一个 XML 格式的文件,我的目标是删除 < 之间出现的任何文本。和 > , 如果标签以 ?xml 开头,则需要删除整行。我知道有 remove / delete /在命令行上使用的函数,但我试图在我的实际 Lisp 代码中进行此删除,但我不知道该怎么做。每次尝试都会出错。

现在这是我读取文件的代码(有效):

;;;Program: Lisp Assignment 1
;;;Author: Mouse

(defun file-lines (file)
;;;returns a list of strings and the number of
;;;lines read.
    (with-open-file (i file)
    (loop for line = (read-line i nil nil)
          and line-count from 0
          while line
          collect line into lines
          finally (return (values lines line-count)))))

我的想法是在 while line 这行之后,我必须输入代码来检查标签,但我不知道该用什么。每次我调用removedelete方法,我得到一个错误。我不知道我是否没有正确地称呼他们或其他什么。有人可以帮忙吗?

最佳答案

我觉得你的问题不是很清楚。为什么你问从字符串列表中删除标签,而你的示例代码从文件中读取行?假设您真的在询问字符串列表,标签是否可以分布在多个字符串上?此外,您询问 removedelete 而没有提及您真正尝试过的内容以及它是如何失败的。如果您想直接更改文件的内容,那么,您不能只是从流中删除内容并期望它起作用。

这是一种通过逐个字符地从流中读取来删除标签的简单方法:

(defun remove-tags (string)
  (flet ((read-tag (instream)
           (loop for char = (read-char instream nil nil)
                 while (not (string= char #\>)))))
    (with-output-to-string (outstream)
      (with-input-from-string (instream string)
        (loop for char = (read-char instream nil nil)
              while char
              if (char= char #\<) do (read-tag instream)
              else do (write-char char outstream))))))


CL-USER> (remove-tags "<p><a href=\"foo\">bar</a> frob <emph>baz</emph> quux</p>")
"bar frob baz quux"

如果你想读取和写入文件,只需将 with-output-to-stringwith-input-from-string 替换为相应的 with-open-file 形式。

但这只是一个让您入门的示例。即使这只是一个学术练习,您也需要使其更加健壮。例如,它失败了:

CL-USER> (remove-tags "<p><a href=\"fo>o\">bar</a>")
"o\">bar"

(如果我没记错的话,XML 字符串中允许使用未转义的右尖括号。)

此外,这既没有经过测试也没有以任何方式优化速度——按字符处理可能太慢,而且它不处理 ?xml 的删除> 标签。所有这些都留给读者作为练习。

出于实用的目的,您可能真的应该只使用其中一个 XML 库,或者使用 regexen 并祈祷。解析和处理 XML 是一个在实际使用中几乎所有语言的许多库中都已经解决的问题,并且有很多细节会出错(如果你真的只是想删除一些标签可能不会,仅此而已,但是 principiis obsta),无论如何这都是一个相当无聊的练习。

关于xml - 在 lisp 程序中删除标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15259211/

相关文章:

java - 如何显示 float 菜单图标?

java - XSD - 验证该元素引用 XML 文件中的其他元素

Scheme Lisp 3 × 3 矩阵的行列式

functional-programming - Jan Willem Klop 的 "(L L L...)"Y 组合器如何工作?

java - Jetty 9 - 嵌入式 - 无法启动 Web 应用程序上下文

html - 如何在 XPath 中通过其 XML 值来识别节点?

python - 尽管 id 存在,Python 中的 Beautiful Soup 找不到 id

facebook-graph-api - 无法在 Facebook 页面 PHP SDK Graph API 上标记用户

svn - SVN可以复制并覆盖目标分支或合并并保留源分支吗?

sockets - 原子地写入套接字