我需要一些编程方面的帮助。我正在使用 Common Lisp 进行编码,并且正在尝试从字符串列表中删除标签。我读入了一个 XML 格式的文件,我的目标是删除 <
之间出现的任何文本。和 >
, 如果标签以 ?xml
开头,则需要删除整行。我知道有 remove
/ delete
/在命令行上使用的函数,但我试图在我的实际 Lisp 代码中进行此删除,但我不知道该怎么做。每次尝试都会出错。
现在这是我读取文件的代码(有效):
;;;Program: Lisp Assignment 1
;;;Author: Mouse
(defun file-lines (file)
;;;returns a list of strings and the number of
;;;lines read.
(with-open-file (i file)
(loop for line = (read-line i nil nil)
and line-count from 0
while line
collect line into lines
finally (return (values lines line-count)))))
我的想法是在 while line
这行之后,我必须输入代码来检查标签,但我不知道该用什么。每次我调用remove
或 delete
方法,我得到一个错误。我不知道我是否没有正确地称呼他们或其他什么。有人可以帮忙吗?
最佳答案
我觉得你的问题不是很清楚。为什么你问从字符串列表中删除标签,而你的示例代码从文件中读取行?假设您真的在询问字符串列表,标签是否可以分布在多个字符串上?此外,您询问 remove
和 delete
而没有提及您真正尝试过的内容以及它是如何失败的。如果您想直接更改文件的内容,那么,您不能只是从流中删除内容并期望它起作用。
这是一种通过逐个字符地从流中读取来删除标签的简单方法:
(defun remove-tags (string)
(flet ((read-tag (instream)
(loop for char = (read-char instream nil nil)
while (not (string= char #\>)))))
(with-output-to-string (outstream)
(with-input-from-string (instream string)
(loop for char = (read-char instream nil nil)
while char
if (char= char #\<) do (read-tag instream)
else do (write-char char outstream))))))
CL-USER> (remove-tags "<p><a href=\"foo\">bar</a> frob <emph>baz</emph> quux</p>")
"bar frob baz quux"
如果你想读取和写入文件,只需将 with-output-to-string
和 with-input-from-string
替换为相应的 with-open-file
形式。
但这只是一个让您入门的示例。即使这只是一个学术练习,您也需要使其更加健壮。例如,它失败了:
CL-USER> (remove-tags "<p><a href=\"fo>o\">bar</a>")
"o\">bar"
(如果我没记错的话,XML 字符串中允许使用未转义的右尖括号。)
此外,这既没有经过测试也没有以任何方式优化速度——按字符处理可能太慢,而且它不处理 ?xml
的删除> 标签。所有这些都留给读者作为练习。
出于实用的目的,您可能真的应该只使用其中一个 XML 库,或者使用 regexen 并祈祷。解析和处理 XML 是一个在实际使用中几乎所有语言的许多库中都已经解决的问题,并且有很多细节会出错(如果你真的只是想删除一些标签可能不会,仅此而已,但是 principiis obsta),无论如何这都是一个相当无聊的练习。
关于xml - 在 lisp 程序中删除标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15259211/