我希望有人能给我一些关于以下包的反馈:
我想编写一个 python 程序,它将一个 .txt 文件作为输入,并将某种 .csv 甚至 excel 格式的结构化数据作为输出。退出项目的 friend 用ANTLR + Java尝试了一些东西,但是德语元音“ä,ö,ü”惹了麻烦。现在我(作为编程初学者)想编写一个可以运行的程序。我知道一些 Matlab,仅此而已。我启动了一个关于 python 编程的 coursera 模块(Python for everyone)来学习基础知识。
我现在想问一下上面提到的“包”pyparsing 是否可以处理德语变音符号,或者我是否会在这里遇到麻烦。
换句话说:如果你要向菜鸟推荐一个python解析策略,你会推荐什么?
最佳答案
文档的第 46 页是 7.15.printables 部分:所有可打印的非空白字符。列出了这些:
>>> len(pp.printables)
94
>>> print pp.printables
0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ!"#$%&'()*+,-
./:;<=>?@[\]^_`{|}~
如您所见,其中没有德语变音符号。这是因为该项目使用标准的 ASCII 编码而不是 utf-8,它可以支持您可能需要的每个字符。这很可能是由于他们使用 Python 2 而不是 Python 3。
编辑:我刚刚在他们的网站上发现了以下内容:
NOTE - Pyparsing 2.x supports Python versions 2.6, 2.7, and 3.x. If you are using Python 2.5 or older, you must specifcally install version 1.5.7. See more info on the News page
理论上,当您为 Python 3 安装模块时,您应该能够使用 utf-8。不幸的是,更新后的文档没有提到可打印文件,所以我不能确定。
关于面向编程初学者的 Python 解析器(需要德语变音),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38173838/