python - pandas dataframe 用循环创建列

标签 python pandas

我正在尝试添加新列并使用 for 循环填充数据,从 Price 列获取数据并将 1000 次迭代插入到新的数据框列中,在 1000 次 Price 列迭代之后再创建一个新列以容纳 1000 次以上,等等。

import pandas as pd

import matplotlib.pyplot as plt

data_frame = pd.read_csv('candle_data.csv', names=['Time', 'Symbol','Side', 'Size', 'Price','1','2','3','4','5'])
price_df = pd.DataFrame()
count_tick = 0
count_candle = 0
for price in data_frame['Price']:
    if count_tick < 1000:
        price_df[count_candle] = price
        count_tick +=1
    elif count_tick == 1000:
        count_tick = 0
        count_candle +=1


price_df.head()

最佳答案

没有必要循环遍历数据框,您可以使用切片来实现这一点,请看下面的示例代码。我已经加载了一个包含 100 行的 Dataframe,并尝试从“col1”的前 50 行创建列“col3”,并从“col1”的接下来 50 行发布该列“col4”。您可以修改以下代码以指向您的列和所需的值

import pandas as pd
import numpy as np

    if __name__ == '__main__':
        col1 = np.linspace(0,100,100)
        col2 = np.linspace(100, 200, 100)
        dict = {'col1':col1,'col2':col2}
        df = pd.DataFrame(dict)
        df['col3']= df['col1'][0:50]
        df['col4'] = df['col1'][50:100]
        print(df)

解决方案 2 基于评论中添加的信息

import pandas as pd
import numpy as np

if __name__ == '__main__':
    pd.set_option('display.width', 100000)
    pd.set_option('display.max_columns', 500)
    ### partition size for example I have taken a low volums 20
    part_size = 20
    ## number generation for data frame
    col1 = np.linspace(0,100,100)
    col2 = np.linspace(100, 200, 100)

    ## create initial data frame
    dict = {'col1':col1,'col2':col2}
    df = pd.DataFrame(dict)
    len = df.shape[0]
    ## tells you how many new columns you need
    rec = int(len/part_size)
    _ = {}
    ## initialize slicing variables
    low =0
    high=part_size
    print(len)
    for i in range(rec):
        if high >= len:
            _['col_name_here{0}'.format(i)] = df[low:]['col1']
            break
        else:
            _['col_name_here{0}'.format(i)] = df[low:high]['col1']
            low = high
            high+= part_size
    df = df.assign(**_)
    print(df)

关于python - pandas dataframe 用循环创建列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58946015/

相关文章:

python pickle转储和加载私有(private)变量

python - 是否值得在小函数中关闭文件?

python - 使用 GDAL 1.6.1 创建 CFloat64 ENVI 文件时出现问题

python-3.x - Pandas 合并意外产生后缀

python - 比较 Pandas 不同年份的同一天

python - 是否可以更改共享对象文件中的共享库引用?

python - 在 fit_transform 之后得到 sklearn.LabelEncoder() 映射

python - 如果列表中的一个条目的键包含另一列中的字符串,则选择该条目

python - 如何在 Python Pandas 中显示分组直方图的标题?

Python/Pandas - drop_duplicates ValueError