python - 使用固定宽度拆分字符串类型的 Pandas 列(类似于具有固定宽度的 Excel 文本到列功能)

标签 python pandas string dataframe fixed-width

我有一个 CCYPair 的数据框和类似于以下的相应现货值:

当前日期范围:

d = {'CCYPair': ['EURUSD', 'USDJPY'], 'Spot': [1.2, 109]}
df = pd.DataFrame(data=d)

我希望将 CCYPair 列拆分为 CCY1 和 CCY2。这可以在 Excel 中使用文本到列或通过左右功能轻松实现。然而,即使在搜索了一段时间之后,我发现在 pandas 数据帧中获得相同的结果非常棘手。

我只能找到 pandas.read_fwf 但那是为了从文件中读取。我已经有了一个数据框,我希望根据固定宽度拆分其中一列。

我确定我在这里遗漏了一些基本的东西 - 只是想不通是什么。

我已经尝试过 df['CCY1'] = df['CCYPair'][0:3] 但这会应用列上的 [0:3] 而不是列中的每个条目.所以我最终得到了前三个 CCYPair 值,然后是 NaN。

预期结果:

d = {'CCY1': ['EUR', 'USD'], 'CCY2': ['USD', 'JPY'], 'Spot': [1.2, 109]}
df = pd.DataFrame(data=d)

最佳答案

您可以尝试提取:

df[['CCY1','CCY2']] = df.CCYPair.str.extract('(.{3})(.*)')

输出:

  CCYPair   Spot CCY1 CCY2
0  EURUSD    1.2  EUR  USD
1  USDJPY  109.0  USD  JPY

关于python - 使用固定宽度拆分字符串类型的 Pandas 列(类似于具有固定宽度的 Excel 文本到列功能),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/66643122/

相关文章:

c - 使用 put 和 strcat 得到的字符串显示额外的字符

python - python中的打印输出(输入输出过程)

python - 我如何从中间件中的 url 访问字符串

Python 计算 Dataframe 中的 Null 值和非 Null 值

python - 在pandas中,如何将数字类型转换为类别类型以与seaborn Hue一起使用

python - pandas 中任意列表的笛卡尔积

c# - 如何逻辑排序字符串

java - 考虑到输入和输出,如何使用 python 执行 java 程序

python - 如何在单元测试中停止来自 subprocess.check_call() 的 AssertionError 消息

string - 删除子字符串中所有出现的测试用例