python - 如何获得 NumPy 数组的描述性统计信息？

我使用以下代码创建一个 numpy-ndarray。该文件有 9 列。我明确键入每一列:

dataset = np.genfromtxt("data.csv", delimiter=",",dtype=('|S1', float, float,float,float,float,float,float,int))

现在我想获得每列的一些描述性统计数据(最小值、最大值、标准差、平均值、中值等)。难道不应该有一种简单的方法来做到这一点吗？

我试过这个:

from scipy import stats
stats.describe(dataset)

但这会返回一个错误:TypeError: cannot perform reduce with flexible type

如何获取创建的 NumPy 数组的描述性统计信息？

最佳答案

import pandas as pd
import numpy as np

df_describe = pd.DataFrame(dataset)
df_describe.describe()

请注意，数据集是您要描述的 np.array。

import pandas as pd
import numpy as np

df_describe = pd.DataFrame('your np.array')
df_describe.describe()

关于python - 如何获得 NumPy 数组的描述性统计信息？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/38583738/