python - Pandas 采样

标签 python pandas

如果我想随机采样 pandas 数据帧,我可以使用 pandas.DataFrame.sample .

假设我随机抽取 80% 的行。如何自动获取另外 20% 未选取的行?

最佳答案

正如 Lagerbaer 所解释的,人们可以向数据帧添加具有唯一索引的列,或者随机打乱整个数据帧。对于后者,

df.reindex(np.random.permutation(df.index))

有效。 (np 表示 numpy)

关于python - Pandas 采样,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39801405/

相关文章:

python - 为什么它重复即使 WHILE 循环更改为 False

python - 查找 Pandas 中最长列的长度

python - 在 Pandas 中,如何根据另一个分类列执行性别(或任何分类变量)的值计数?

python - 仅将数字的字符串表示形式转换为 Pandas 中的数字

python - “<' not supported between instances of ' 方法”和 'method' - Python、Django

python - 如何对依赖 urllib2 的模块进行单元测试?

python - 根据其他行的某些条件获取 pandas 行的内容

python - 检查两个 df 是否相同模式并在 pandas 中使用 groupby

python - 高斯 SVM 参数 C 和 gamma

python - 使用嵌套 for 循环比较不同的 Pandas 数据帧