python - 从 stackoverflow 中的问题重新创建 pandas 数据框

标签 python pandas dataframe

这是试图回答有关 pandas 数据框问题的人提出的问题。考虑一个具有给定数据集的问题,该数据集只是可视化(而不是实际代码),例如:

   numbers letters       dates         all
0        1       a  20-10-2020         NaN
1        2       b  21-10-2020           b
2        3       c  20-11-2020           4
3        4       d  20-10-2021  20-10-2020
4        5       e  10-10-2020        3.14

是否可以在 python 中将其作为数据框或字典快速导入?到目前为止,我复制了给定的文本并通过制作字符串(添加 '')等将其转换为数据框。

我认为有两种“解决方案”:

  1. 创建一个将文本作为输入的函数,它以某种方式将其转换为数据框。
  2. 在文本编辑器(我使用 spyder)中使用一些功能可以为我们完成这个技巧。

最佳答案

读取剪贴板

您可以使用 pd.read_clipboard()可选地使用分隔符(例如 pd.read_clipboard('\s\s+') 如果您在列名中有日期时间字符串或空格并且列至少由两个空格分隔):

  • 选择问题上的文本并复制到剪贴板 (ctrl+c/command-c)
  • 移动到 python shell 或笔记本并运行 pd.read_clipboard()

请注意,这并不适用于所有平台。

read_csv + io.StringIO

对于更复杂的格式,结合read_csv结合 io.StringIO :

data = '''
   numbers letters       dates         all
0        1       a  20-10-2020         NaN
1        2       b  21-10-2020           b
2        3       c  20-11-2020           4
3        4       d  20-10-2021  20-10-2020
4        5       e  10-10-2020        3.14
'''

import io

df = pd.read_csv(io.StringIO(data), sep='\s+')
df

关于python - 从 stackoverflow 中的问题重新创建 pandas 数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/73814238/

相关文章:

python - 有没有办法遍历列表并返回以其内容命名的变量?

python - 如何将包含日期列表作为字符串的列展平为日期?

python - 如何安排作业在云中执行 Python 脚本以将数据加载到 bigquery?

python - 如何在我的 Jupyter Sagemaker 笔记本实例中导入最新版本的 pandas?

python - 分配前引用的列表理解变量

excel - 如何从 Excel 中的整数列中过滤字符串以在 Python 中处理

r - R 中是否有一个函数同时具有 bind_rows() 和 bind_cols()?

r - 尝试同时对不同的列数求和

python - PyDrive 只获取我的文件和与我共享的文件。 Python

python - 在 matplotlib 中绘制预测点和 ground_truth 点之间的线