这是试图回答有关 pandas 数据框问题的人提出的问题。考虑一个具有给定数据集的问题,该数据集只是可视化(而不是实际代码),例如:
numbers letters dates all
0 1 a 20-10-2020 NaN
1 2 b 21-10-2020 b
2 3 c 20-11-2020 4
3 4 d 20-10-2021 20-10-2020
4 5 e 10-10-2020 3.14
是否可以在 python 中将其作为数据框或字典快速导入?到目前为止,我复制了给定的文本并通过制作字符串(添加 ''
)等将其转换为数据框。
我认为有两种“解决方案”:
- 创建一个将文本作为输入的函数,它以某种方式将其转换为数据框。
- 在文本编辑器(我使用 spyder)中使用一些功能可以为我们完成这个技巧。
最佳答案
读取剪贴板
您可以使用 pd.read_clipboard()
可选地使用分隔符(例如 pd.read_clipboard('\s\s+')
如果您在列名中有日期时间字符串或空格并且列至少由两个空格分隔):
- 选择问题上的文本并复制到剪贴板 (ctrl+c/command-c)
- 移动到 python shell 或笔记本并运行
pd.read_clipboard()
请注意,这并不适用于所有平台。
read_csv
+ io.StringIO
对于更复杂的格式,结合read_csv
结合 io.StringIO
:
data = '''
numbers letters dates all
0 1 a 20-10-2020 NaN
1 2 b 21-10-2020 b
2 3 c 20-11-2020 4
3 4 d 20-10-2021 20-10-2020
4 5 e 10-10-2020 3.14
'''
import io
df = pd.read_csv(io.StringIO(data), sep='\s+')
df
关于python - 从 stackoverflow 中的问题重新创建 pandas 数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/73814238/