我处理一个大型数据集,其中基于 A 列,我想以特定方式处理其他一些列。
如果 A 列有“processLastNameOnly”,那么我只处理 LastName。 如果 A 列有“processMiddleAsFirst”,那么我将中间名作为名字处理。
等等
这些规则很多而且很复杂,我想以某种最好的标准“规则集”格式将它们保存在一个单独的文件中。
这些规则是否有通用的格式?如何在 Python 代码中使用它?
最佳答案
Python 的妙处在于一切皆对象,包括函数。因此,您可以创建一个字典,将字符串(在 columnA 中)映射到一个函数。
def processLastNameOnly(...):
pass # process data here
def processMiddleAsFirst(...):
pass # process data here
ruleset = {'processLastNameOnly': processLastNameOnly,
'processMiddleAsFirst': processMiddleAsFirst}
# Call the function from the dict with the appropriate args
ruleset[columnA_value](...)
您可以将规则集和函数存储在单独的文件中,然后像导入任何 Python 对象/函数一样导入该文件。
可以查看this Stack Exchange link进行深入讨论。
关于python - 如何在 Python 中实现规则集,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33712188/