我正在尝试使用 Python 循环遍历格式如下的数据框列:
Town 1, AL, USA
Town 2, AL, USA
Town 3, AK, USA
Town 4, CA, USA
Town 5, DE, USA
Town 6, MI, USA
我一直在尝试将 split()
方法与原始数据框(包括犯罪描述和 URL 列)和单独的列一起使用,既作为数据框又作为 Series 对象.这些对象都没有可用的方法 split()。
所需的输出将只是 STATE 缩写的另一列,所以我知道我正在尝试找到一个等效的 df.split(', ')
并附加第二个 [ 1] 来自该系列或数据框的拆分的索引。 (如果我说错了,请指正)。
我该怎么做?
最佳答案
您可以使用 vectorized string methods ,例如df["col"].str.split(", ").str[1]
:
>>> df
col
0 Town 1, AL, USA
1 Town 2, AL, USA
2 Town 3, AK, USA
3 Town 4, CA, USA
4 Town 5, DE, USA
5 Town 6, MI, USA
>>> df["col"].str.split(", ")
0 [Town 1, AL, USA]
1 [Town 2, AL, USA]
2 [Town 3, AK, USA]
3 [Town 4, CA, USA]
4 [Town 5, DE, USA]
5 [Town 6, MI, USA]
Name: col, dtype: object
>>> df["col"].str.split(", ").str[1]
0 AL
1 AL
2 AK
3 CA
4 DE
5 MI
Name: col, dtype: object
关于python - 通过 Dataframe 的字符串拆分循环,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24853385/