python - 通过 Dataframe 的字符串拆分循环

标签 python string pandas split dataframe

我正在尝试使用 Python 循环遍历格式如下的数据框列:

Town 1, AL, USA
Town 2, AL, USA
Town 3, AK, USA
Town 4, CA, USA
Town 5, DE, USA
Town 6, MI, USA

我一直在尝试将 split() 方法与原始数据框(包括犯罪描述和 URL 列)和单独的列一起使用,既作为数据框又作为 Series 对象.这些对象都没有可用的方法 split()。

所需的输出将只是 STATE 缩写的另一列,所以我知道我正在尝试找到一个等效的 df.split(', ') 并附加第二个 [ 1] 来自该系列或数据框的拆分的索引。 (如果我说错了,请指正)。

我该怎么做?

最佳答案

您可以使用 vectorized string methods ,例如df["col"].str.split(", ").str[1]:

>>> df
               col
0  Town 1, AL, USA
1  Town 2, AL, USA
2  Town 3, AK, USA
3  Town 4, CA, USA
4  Town 5, DE, USA
5  Town 6, MI, USA
>>> df["col"].str.split(", ")
0    [Town 1, AL, USA]
1    [Town 2, AL, USA]
2    [Town 3, AK, USA]
3    [Town 4, CA, USA]
4    [Town 5, DE, USA]
5    [Town 6, MI, USA]
Name: col, dtype: object
>>> df["col"].str.split(", ").str[1]
0    AL
1    AL
2    AK
3    CA
4    DE
5    MI
Name: col, dtype: object

关于python - 通过 Dataframe 的字符串拆分循环,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24853385/

相关文章:

python - 有效地组合 pandas 数据框不同列上的最小值/最大值

python - 无法使用 psutil.Process()

c# - C#中如何替换字符串中的字符

Php - 如何将多个键值数组转换为 | (管道)分隔字符串

Python Pandas Fillna 中位数不起作用

python pandas 为我分组的列提供了一个关键错误,即使 bool 表达式显示该列是数据帧的一部分

python - Selenium Chrome Webdriver 进程在本地工作但不在 Heroku 上工作

python - 将 linspace 向量发送到函数会使该向量在函数启动之前全部为零

php - 在 web2py 中保留文件上传 html 表单

c++ - 尝试将字符串作为类的参数传递,但在 C++ 中它被识别为字符数组