原始数据是:
输出数据为:
import pandas as pd
signal_data = pd.read_csv('B.txt').T
print pd.read_csv('B.txt').T
dates = pd.date_range('2015-10-1', periods=19)
signal_data_df= pd.DataFrame(signal_data, index=dates, columns=['PCLN', 'SPY', 'QCOM', 'AAPL', 'USB', 'AMGN', 'GS', 'BIIB', 'AGN'])
print signal_data_df
最佳答案
因为您传递 df 作为数据源,所以它会重用 df 中的索引和列,因此当您传递替代索引和列值时,您实际上是在对原始 df 重新建立索引,因此会出现 NaN
值(value)观无处不在。您可以直接重命名列并覆盖索引:
signal_data = pd.read_csv('B.txt').T
signal_data.columns=['PCLN', 'SPY', 'QCOM', 'AAPL', 'USB', 'AMGN', 'GS', 'BIIB', 'AGN']
signal_data.index = dates
或者让您的代码正常工作,调用 .values
将 df 作为匿名 np 数组数据返回:
signal_data_df= pd.DataFrame(signal_data.values, index=dates, columns=['PCLN', 'SPY', 'QCOM', 'AAPL', 'USB', 'AMGN', 'GS', 'BIIB', 'AGN'])
关于python - 为什么我使用pd.DataFrame后我的txt文件被改变了?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33389439/