python - 为什么我使用pd.DataFrame后我的txt文件被改变了?

标签 python pandas

原始数据是:

enter image description here

输出数据为:

enter image description here

    import pandas as pd

    signal_data = pd.read_csv('B.txt').T
    print pd.read_csv('B.txt').T

    dates = pd.date_range('2015-10-1', periods=19)

    signal_data_df= pd.DataFrame(signal_data, index=dates, columns=['PCLN', 'SPY', 'QCOM', 'AAPL', 'USB', 'AMGN', 'GS', 'BIIB', 'AGN'])
    print signal_data_df       

最佳答案

因为您传递 df 作为数据源,所以它会重用 df 中的索引和列,因此当您传递替代索引和列值时,您实际上是在对原始 df 重新建立索引,因此会出现 NaN值(value)观无处不在。您可以直接重命名列并覆盖索引:

signal_data = pd.read_csv('B.txt').T
signal_data.columns=['PCLN', 'SPY', 'QCOM', 'AAPL', 'USB', 'AMGN', 'GS', 'BIIB', 'AGN']
signal_data.index = dates

或者让您的代码正常工作,调用 .values 将 df 作为匿名 np 数组数据返回:

signal_data_df= pd.DataFrame(signal_data.values, index=dates, columns=['PCLN', 'SPY', 'QCOM', 'AAPL', 'USB', 'AMGN', 'GS', 'BIIB', 'AGN'])

关于python - 为什么我使用pd.DataFrame后我的txt文件被改变了?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33389439/

相关文章:

javascript - 使用 HTML 显示 MongoDB 文档

python - ImportError : No module named pandas. Pandas 安装 pip

python - "Pivot"将 Pandas DataFrame 转换为 3D numpy 数组

python - 如何用 pandas reshape 数据框

python - 使用 "src"布局在 Python 项目中使用 PyTest

python - Django 应用程序无法写入日志处理程序;没有权限

python - 使用 pytest 和 pytest-mock 模拟整个包

Python:检查给定路径是否存在非目录文件

python - 为 Pandas 中列的子集添加值

python - 从回调函数渲染数据表 - Dash