python - 如何在 Google Colab 中读取 csv 到数据框

标签 python csv dataframe google-colaboratory

我正在尝试读取我本地存储在我的机器上的 csv 文件。 (仅供引用,这是来自 Kaggle 的泰坦尼克号数据,即 here。)

来自 this我了解到您可以使用此代码导入数据,这对我来说效果很好。

from google.colab import files
uploaded = files.upload()

我迷路的地方是如何从这里将其转换为数据框。 sample google notebook page上面的答案中列出的没有谈论它。

我正在尝试使用 from_dict 命令将字典 uploaded 转换为数据帧,但无法使其工作。有一些关于将 dict 转换为数据框的讨论 here但解决方案不适用于我(我认为)。

总结一下,我的问题是:

How do I convert a csv file stored locally on my files to pandas dataframe on Google Colaboratory?

最佳答案

第 1 步 - 将您的 Google Drive 安装到 Collaboratory

from google.colab import drive 
drive.mount('/content/gdrive')

第 2 步 - 现在您将在左侧 Pane (文件资源管理器)中看到您的 Google Drive 文件。右键单击需要导入的文件并选择 çopy 路径。然后像往常一样在 pandas 中导入,使用这个复制的路径。

import pandas as pd 
df=pd.read_csv('gdrive/My Drive/data.csv')

完成!

关于python - 如何在 Google Colab 中读取 csv 到数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48340341/

相关文章:

python - Postgresql 分区和 sqlalchemy

javascript - 管道中的 csv 解析错误处理

python - 将 Pandas 系列转换为 DataFrame

Python re.groups 不显示所有子组

python - base 64(GNU/Linux 与 python)

c# - filehelpers - 解析可变行长度

java - 编辑 csv 文件的最佳方法是什么

python - 更改列中的所有第一个值,从其他列分组

python - Pandas :如何找到每行最频繁的值?

python - uwsgi 进程死于 "libgcc_s.so.1 must be installed for pthread_cancel to work"