python - 单线程脚本在多核处理器上消耗过多的 CPU

标签 python python-3.x cpu-usage

我编写了一段代码来帮助在恒定时间间隔内从非常量数据集中积累一些数据。它在我当前的 6 核处理器(Intel i5-8400)计算机上按预期工作,消耗了 ~25% 的 CPU 使用率。问题是现在我正试图在另一台有 40 个内核的计算机(Intel Xeon E5-2630 v4)上重新运行相同的代码,并且一旦它启动以下功能,它就会飙升至 55% 的 CPU 使用率,而我是预计它会接近 5%。

这已成为一个问题,因为我与其他人共用这台计算机,这妨碍了他们的工作。比较两台计算机之间运行脚本所需的时间,它似乎可以忽略不计,所以我不确定它是否真的使用了所有处理器(这是有道理的,因为我不知道如何多线程循环!)

我以前曾试图找到答案,我能找到的最接近的答案是它可能是由于 while 循环 ( Python script too much cpu usage ) 但我认为这不适用于我的情况......大多数其他问题与如何增加 cpu 使用率有关,这与我的问题相反。

def accumulate_value (table_data_1,i_time_step):

    # table_data_1 formatted as a dataframe with columns names ['value','date_time']

    table_data_1.reset_index(drop=True,inplace=True)

    table_data_1["delta_time"] = table_data_1["date_time"].diff(periods=1).dt.seconds/60
    table_data_1["delta_time_aux"] = 0
    table_data_1["value_aux"] = 0
    table_data_1["datetime_stamp"] = pd.to_datetime(0)


    # Start loop

    for aux_counter_1 in table_data_1.index.values.tolist():

        table_data_1_aux1 = table_data_1.loc[aux_counter_1:,:]
        table_data_3 = table_data_1_aux1.loc[table_data_1_aux1.index[table_data_1_aux1.loc[:,'date_time'] - table_data_1_aux1.loc[aux_counter_1,'date_time'] <= datetime.timedelta(minutes=i_time_step)],:]


        if len(table_data_3.index) > 1 :

            table_data_1.iloc[aux_counter_1,3] = datetime.timedelta.total_seconds(table_data_3.iloc[-1,1] - table_data_3.iloc[0,1])/60
            if table_data_1.iloc[aux_counter_1,3] >= i_time_step:
                table_data_1.iloc[aux_counter_1,4] = table_data_3.loc[:,'value'].sum() - table_data_3.iloc[-1,0]
            else:
                table_data_1.iloc[aux_counter_1,4] = table_data_3.loc[:,'value'].sum()
            table_data_1.iloc[aux_counter_1,5] = table_data_3.iloc[-1,1]

        elif len(table_data_3.index) == 1 :
            table_data_1.iloc[aux_counter_1,3] = 0
            table_data_1.iloc[aux_counter_1,4] = table_data_3.loc[:,'value'].sum()
            table_data_1.iloc[aux_counter_1,5] = table_data_3.iloc[-1,1]
        else:
                print(table_data_3)


    table_data_1["year_stamp"] = table_data_1["datetime_stamp"].dt.year

    table_data_2 = table_data_2

    return table_data_2

最佳答案

我认为问题是 numpy 正在创建大量线程,假设它是机器上运行的唯一进程。

参见 Limit number of threads in numpy了解如何限制使用的线程数。

关于python - 单线程脚本在多核处理器上消耗过多的 CPU,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54103107/

相关文章:

python - 在 Python 解释器中重新加载

python - flask 服务器 : Using a data in the same session

python - Graphlab get_dependencies() SSL 证书验证失败

python - 是否可以在 lambda 函数中创建多个语句?

python - 无法在 docker 中重新创建 Conda 环境

c# - 如何有效地获取远程 linux 机器的平均 cpu 使用率?

c# - C#中的多线程CPU使用率

java - PNG 在 Mac 上的 Java 中导致大量 CPU 使用

python - 使用 gspread 创建的电子表格正在与我的组织中的所有用户共享

python - Python 中的 set.copy() 是原子的吗?