我正在尝试删除“H”后面的所有值并将其存储到列中。
df['col1'] = df['col1'].str.split('H').str[0]
但是 pyspark 给了我错误:Column'对象不可调用
最佳答案
一种可能的解决方案是为 DataFrame
添加 expand=True
,然后选择第二列:
df['col1'] = df['col1'].str.split('H', expand=True).iloc[:, 1]
或者:
df['col1'] = df['col1'].str.split('H', expand=True)[1]
关于python - Pandas:列对象不可调用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49217321/