<分区>
我知道这听起来很愚蠢,但我不知道如何处理电子表格中等于“NA”(在我的例子中,它是“北美”的缩写)的数据。当我执行 Pandas“read_excel”时,数据以“NaN”而不是“NA”的形式引入。
“NA”是否也像 NaN 一样被视为“非数字”?
输入的 Excel 工作表单元格包含 NA。数据框包含“NaN”。
有什么办法可以避免这种情况?
<分区>
我知道这听起来很愚蠢,但我不知道如何处理电子表格中等于“NA”(在我的例子中,它是“北美”的缩写)的数据。当我执行 Pandas“read_excel”时,数据以“NaN”而不是“NA”的形式引入。
“NA”是否也像 NaN 一样被视为“非数字”?
输入的 Excel 工作表单元格包含 NA。数据框包含“NaN”。
有什么办法可以避免这种情况?
最佳答案
您可以通过在 pandas.read_excel() 中使用
如下。keep_defaul_na=False
来关闭 na-values
的自动检测
I am using the demo
test.xlsx
file that I created in the Dummy Data section.
pd.read_excel('test.xlsx', keep_default_na=False)
## Output
# Region Country
# 0 NA Canada
# 1 NA USA
# 2 SA Brazil
# 3 EU Sweden
# 4 AU Australia
import pandas as pd
# Create a dummy dataframe for demo purpose
df = pd.DataFrame({'Region': ['NA', 'NA', 'SA', 'EU', 'AU'],
'Country': ['Canada', 'USA', 'Brazil', 'Sweden', 'Australia']})
# Create an excel file with this data
df.to_excel('test.xlsx', index=False)
# Show dataframe
print(df)
输出
Region Country
0 NA Canada
1 NA USA
2 SA Brazil
3 EU Sweden
4 AU Australia
关于python - 如何处理 Pandas 中等于 "NA"的列?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62842433/