python - 如何减小数据框的大小?

标签 python machine-learning

我试图通过以下代码从目录中读取多个 csv 文件,但它将每个数据帧的大小从 150000 更改为 150001,这在我使用大小为 150000 的训练数据集输出进行测试时会出现问题。任何机构都可以解决这个问题吗?因为我是 ML 的完全初学者,所以我们将不胜感激,请注意,dataFrame.iloc() 在这种情况下不起作用。

# indir = ".//test"
# os.chdir(indir)
fileList = glb.glob("*.csv")
# dfList = []
for filenames in fileList:
  print(filenames)
  df = pd.read_csv(filenames, header=None`
  df[0][0] = 0
  df.iloc[0:]
  print(df.size) 
#   dfList.append(df)

最佳答案

你为什么要放 header = None 。如果您已经知道 csv 文件的第一行是列名称,则输入 header = 0这将告诉 pandas 将第一行读取为标题而不是一行。这将产生正确的尺寸。

此外,对于您的代码,您不会删除第一行,因此它是错误的。要删除第一行,您必须使用 df = df.iloc[1:]

关于python - 如何减小数据框的大小?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56361557/

相关文章:

python - Pandas 数据框导出到 excel 导致 TypeError

r - "survivalsvm"预测什么?

python - 如何在简单的 Tensorflow 程序中计算神经元数量?

python - 在 Windows 上用 Python 进行文学编程的最佳方法是什么?

python - 尝试在两个文件之间切换文本

python - 如何使用可选参数构建装饰器?

python - 改变 turtle 的外观

ios - 准备 CoreML 模型时出错 : "<something>" is not supported for CoreML code generation

python - 比较 tf.string 和 python 字符串

machine-learning - scikit-learn 中的 SVC 和 LinearSVC 在什么参数下等效?