python - Azure数据集.to_pandas_dataframe()错误

标签 python pandas azure machine-learning azure-machine-learning-service

我正在学习 udemy 上的 azure ml 类(class),但无法解决以下错误:

数据集的“to_pandas_dataframe”操作执行失败(id='id', name='使用 SDK 的贷款应用程序', version=1, error_code=None, exception_type=PandasImportError)

这是提交脚本的代码:

from azureml.core import Workspace, Experiment, ScriptRunConfig, 
Environment


ws = Workspace.from_config(path="./config")


new_experiment = Experiment(workspace=ws,
                            name="Loan_Script")


script_config = ScriptRunConfig(source_directory=".",
                                script="180 - Script to Run.py")

script_config.framework = "python"
script_config.environment = Environment("conda_env")

new_run = new_experiment.submit(config=script_config)

这是正在运行的脚本:

from azureml.core import Workspace, Datastore, Dataset, 
Experiment

from azureml.core import Run

ws = Workspace.from_config(path="./config")
az_store = Datastore.get(ws, "bencouser_sdk_blob01")
az_dataset = Dataset.get_by_name(ws, name='Loan Applications Using SDK')
az_default_store = ws.get_default_datastore()


#%%----------------------------------------------------
# Get context of the run
#------------------------------------------------------


new_run = Run.get_context()


#%%----------------------------------------------------
# Stuff that will be logged
#------------------------------------------------------

df = az_dataset.to_pandas_dataframe()

total_observations = len(df)

nulldf = df.isnull().sum()

#%%----------------------------------------------------
# Complete the Experiment 
#------------------------------------------------------

new_run.log("Total Observations:", total_observations)

for columns in df.columns:
    new_run.log(columns, nulldf[columns])

new_run.complete()

我已经在实验之外运行了 .to_pandas_dataframe() 部分,并且它运行没有错误。我还尝试了以下操作(驱动程序日志中推荐):

InnerException 无法导入 pandas。通过运行以下命令确保安装兼容版本: pip install azureml-dataprep[pandas]

我以前见过有人遇到过这个问题,但我找不到解决方案,感谢任何帮助。

最佳答案

在进行实验时,创建了一个新的 azure 环境,但没有安装 pandas。要安装 pandas(如果使用 anaconda nav),请进入 anaconda nav 窗口中的环境,单击 azure env,转到已卸载的软件包并搜索 pandas,单击安装。一旦完成,它就起作用了。

关于python - Azure数据集.to_pandas_dataframe()错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/71939604/

相关文章:

wcf - 从 Silverlight 5 客户端访问 Azure 表存储数据的最佳实践

python - 无法运行libclang:错误“找不到指定的模块”

python - 使用 Pandas 确定一个 CSV 文件中的值是否在另一个 CSV 文件中丢失

python - Python 中有写入 MySQL 数据库的权限吗?

python - Pandas 'describe' 未返回所有列的摘要

python - 确定数组是否已排序的最快方法是什么?

c# - Azure 服务总线中的死信队列中的消息是否会过期?

azure - 我可以拥有多少个 eventhub 命名空间?

python - 将 Python Decimal 对象格式化为指定的精度

python - 使用非线性 SVM 时如何解释类​​别权重?