给定以下数据框:
import pandas as pd
import numpy as np
df = pd.DataFrame({'A':['1a',np.nan,'10a','100b','0b'],
})
df
A
0 1a
1 NaN
2 10a
3 100b
4 0b
我想从每个单元格(它们存在的地方)中提取数字。 期望的结果是:
A
0 1
1 NaN
2 10
3 100
4 0
我知道这可以用 str.extract
来完成,但我不确定怎么做。
最佳答案
给它一个正则表达式捕获组:
df.A.str.extract('(\d+)')
给你:
0 1
1 NaN
2 10
3 100
4 0
Name: A, dtype: object
关于python - Pandas 从字符串中提取数字,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37683558/