python - 将 pandas DataFrame 从函数中提取到全局变量

标签 python pandas

我是 pandas 和 python 的新手。

我正在尝试将我在函数中创建的 pandas DataFrame 提取到可以在将来的函数中使用的全局变量。

我的代码:


def initialize_analyticsreporting():
    credentials = ServiceAccountCredentials.from_json_keyfile_name(
        KEY_FILE_LOCATION, SCOPES)

    analytics = build('analyticsreporting', 'v4', credentials=credentials)

    return analytics


def get_report(analytics):

    return analytics.reports().batchGet(
        body={
            'reportRequests': [
                {
                    'viewId': VIEW_ID,
                    'pageSize': 100000,
                    'dateRanges': [{'startDate': '7daysAgo', 'endDate': 'yesterday'}],
                    'metrics': [{'expression': 'ga:sessions'}],
                    'dimensions': [{'name': 'ga:country'}, {'name': 'ga:hostname'}, {'name': 'ga:pagePathLevel1'}, {'name': 'ga:pagePathLevel2'}, {'name': 'ga:keyword'}, {'name': 'ga:adMatchedQuery'}, {'name': 'ga:operatingSystem'}, {'name': 'ga:hour'}, {'name': 'ga:exitPagePath'}]
                }]
        }
    ).execute()


def print_response(response):
    list = []
    for report in response.get('reports', []):
        columnHeader = report.get('columnHeader', {})
        dimensionHeaders = columnHeader.get('dimensions', [])
        metricHeaders = columnHeader.get(
            'metricHeader', {}).get('metricHeaderEntries', [])
        rows = report.get('data', {}).get('rows', [])

    for row in rows:
        dict = {}
        dimensions = row.get('dimensions', [])
        dateRangeValues = row.get('metrics', [])
        for header, dimension in zip(dimensionHeaders, dimensions):
            dict[header] = dimension

        for i, values in enumerate(dateRangeValues):
            for metric, value in zip(metricHeaders, values.get('values')):
                if ',' in value or '.' in value:
                    dict[metric.get('name')] = float(value)
                else:
                    dict[metric.get('name')] = int(value)

        list.append(dict)

    df = pd.DataFrame(list)
    return df


def main():
    analytics = initialize_analyticsreporting()
    response = get_report(analytics)
    print_response(response)

if __name__ == '__main__':
    main()

此时,在调用 main() 后,我可以在 print_response' 函数内进行 print(df) 。但我希望能够在函数外部调用 print_response` 函数中的 df,例如使 df 可以全局访问。

感谢您的建议。

最佳答案

您可以简单地分配给函数内的全局变量,或者返回值并在调用函数时对其进行分配。全局变量可以预先声明,也可以在函数中首次声明,但需要使用关键字global

df1 = None

def f():
    global df1, df2
    df1 = pd.DataFrame()
    df2 = pd.DataFrame()
    return pd.DataFrame()

df3 = f()
# Now df 1, 2 and 3 are all global DataFrames

是否应该使用全局变量是另一个话题。您可以从函数中返回任何内容,并将其传递给其他函数。

def f() -> pd.DataFrame:
    return pd.DataFrame()

def g(df: pd.DataFrame):
    # Do stuff with df

def main():
    df = f()
    g(df)

关于python - 将 pandas DataFrame 从函数中提取到全局变量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59527958/

相关文章:

python - Pandas 读取 csv 失败

python - 如何在 ldaps 请求中更改我的 ssl 密码?

python - Scikit-learn - 多项逻辑回归的错误输入形状错误

python - 将 Dataframe 列中的值除以同一列中的前一个值

python - 指数平滑平均

jQuery parseJSON 对象问题/问题

python - pandas 中列子集的分组

python 在 xml 文件中编码'(引用)

python - Pydantic 场没有值(value)

Python 正则表达式 - 保持字母字符连续相邻/在数字序列内