<分区>
我正在尝试解析来自 NOAA 的 Storm 数据。经过一些清理和解析后,我得到了一个类似这样的 DataFrame:
import pandas as pd
data = { 'ID' : [1, 2, 3, 4, 5, 6],
'EVENT_TYPE': ['Flood', 'Hail', 'Fire', 'Tornado', 'Flood', 'Fire'],
'Property_Damage': ['2.5K', 0, '.4M', "1.00K", NaN, "1K"]}
df = pd.DataFrame(data)
郑重声明,此示例 DataFrame 只是一种简化。真正的 DataFrame 有大约。 25 列和 2200 万行。我想将 df['Property_Damage']
中的值从字符串转换为数值。我想要的结果看起来类似于 [2500, 0, 400000, 1000, 0, 1000]
。
我知道我假设 NaN
值可以替换为 0
。我试图用
damage_property_split = df['Propery_Damage'].str.split([-1], expand=True)
但这不适用于 0
或 NaN
的记录。
什么是最好的转换方式
['2.5K', 0, '.4M', "1.00K", NaN, "1K"]
到 [2500, 0, 400000, 1000, 0, 1000 ]
?
感谢您的帮助!!!