面向编程初学者的 Python 解析器(需要德语变音)

标签 python parsing pyparsing

我希望有人能给我一些关于以下包的反馈:

Pyparsing

我想编写一个 python 程序,它将一个 .txt 文件作为输入,并将某种 .csv 甚至 excel 格式的结构化数据作为输出。退出项目的 friend 用ANTLR + Java尝试了一些东西,但是德语元音“ä,ö,ü”惹了麻烦。现在我(作为编程初学者)想编写一个可以运行的程序。我知道一些 Matlab,仅此而已。我启动了一个关于 python 编程的 coursera 模块(Python for everyone)来学习基础知识。

我现在想问一下上面提到的“包”pyparsing 是否可以处理德语变音符号,或者我是否会在这里遇到麻烦

换句话说:如果你要向菜鸟推荐一个python解析策略,你会推荐什么?

最佳答案

文档的第 46 页是 7.15.printables 部分:所有可打印的非空白字符。列出了这些:

>>> len(pp.printables)
94
>>> print pp.printables
0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ!"#$%&'()*+,-
./:;<=>?@[\]^_`{|}~

如您所见,其中没有德语变音符号。这是因为该项目使用标准的 ASCII 编码而不是 utf-8,它可以支持您可能需要的每个字符。这很可能是由于他们使用 Python 2 而不是 Python 3。

编辑:我刚刚在他们的网站上发现了以下内容:

NOTE - Pyparsing 2.x supports Python versions 2.6, 2.7, and 3.x. If you are using Python 2.5 or older, you must specifcally install version 1.5.7. See more info on the News page

理论上,当您为 Python 3 安装模块时,您应该能够使用 utf-8。不幸的是,更新后的文档没有提到可打印文件,所以我不能确定。

关于面向编程初学者的 Python 解析器(需要德语变音),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38173838/

相关文章:

python - 在numpy数组中查找类型转换失败的索引

python mahotas : Applying threshold filter and saving image as pgn

python - 何时创建 "instance"?

c# - Int32.Parse()如何准确解析String?

html - XSLT 解析存储在属性中的转义 HTML,并将该属性的内容转换为元素的内容

java - 如何从多个字符串中解析文本?

python - Django 设置 : raise KeyError, 引发 ImproperlyConfigured 或使用默认值?

python-2.7 - Python 3 的 Pyparsing

python - 去除标签内容之外的文本

python - 使用 PyParsing 的两个标记之间的字符串