我正在编写一个函数,该函数创建一个数据框并向其附加一个新列。这个新列是基于其他列数据的哈希:
df['uniqueid'] = df[['column_a', 'column_b', ... 'column_x']].\
apply(lambda x: ed.generate_unique_ids(
[
x['column_a'],
x['column_b'],
...
x['column_x']
]), axis=1)
是否可以将此代码写在更具可读性的内容上?我不知道如何提高可读性。
基本上,我想选择几列并将其传递给其他函数,该函数将根据这些值给我一个哈希值。
我是 Python 和 pandas 的新手。
最佳答案
这更多的是一个代码审查问题,但是您可以通过迭代底层列表/数组并将它们直接传递到列表理解中的函数来提高性能和可读性。
cols = ['column_a', 'column_b', ... 'column_x']
df['unique_id'] = [ed.generate_unique_ids(r) for r in df[cols].values.tolist()]
关于python - 将 pandas 转换为更具可读性的内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55107981/