我使用以下代码创建一个 numpy-ndarray。该文件有 9 列。我明确键入每一列:
dataset = np.genfromtxt("data.csv", delimiter=",",dtype=('|S1', float, float,float,float,float,float,float,int))
现在我想获得每列的一些描述性统计数据(最小值、最大值、标准差、平均值、中值等)。难道不应该有一种简单的方法来做到这一点吗?
我试过这个:
from scipy import stats
stats.describe(dataset)
但这会返回一个错误:TypeError: cannot perform reduce with flexible type
如何获取创建的 NumPy 数组的描述性统计信息?
最佳答案
import pandas as pd
import numpy as np
df_describe = pd.DataFrame(dataset)
df_describe.describe()
请注意,数据集是您要描述的 np.array。
import pandas as pd
import numpy as np
df_describe = pd.DataFrame('your np.array')
df_describe.describe()
关于python - 如何获得 NumPy 数组的描述性统计信息?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38583738/