Azure机器学习: Creating ML Pipeline from YAML fails: TabularDataset does not support mount.仅FileDataset支持挂载

标签 azure yaml azure-machine-learning-service

我是 Azure 机器学习新手,正在尝试创建一个简单的 ML 管道。 AzureML 支持 YAML 来定义 ML 管道,此处进行了描述 ( https://learn.microsoft.com/en-us/azure/machine-learning/reference-pipeline-yaml )。

我遇到的一个错误是,当我使用 YAML 文件从“az ml pipeline create”创建管道时,即使我为 data_references 的 bind_mode 指定“download”,它也会返回以下消息。

Messeage: "<class azureml.data.tabular_dataset.TabularDataset'> does not support mount. Only FileDataset supports mount"

环境:
操作系统:Windows 10
Azure CLI:2.11.1

表格数据集的bind_mode似乎不起作用或者我错过了一些东西。我感到困惑的原因是,正如您在上面链接中描述的示例 yaml 文件中看到的那样,具有“bind_mode:download”的数据集应该可以工作。

下面是示例 YAML,其中包含一个名为“dataset1”的表格格式的已定义数据集。

示例 YAML:

pipeline:
    name: "Sample ML pipeline YAML"
    data_references:
        sampleDS:
            dataset_name: dataset1
            bind_mode: download
    default_compute: compute-name
    steps:
        SampleStep:
            type: PythonScriptStep
            name: SampleProcessing
            script_name: processing.py
            allow_reuse: True
            source_directory: ".\\src\\pipeline\\steps"
            inputs:
                input_ds:
                    source: sampleDS

当 data_references 更改为以下内容(直接指定数据存储中的路径,而不是通过注册的数据集)时,它可以工作。

    name: "Sample ML pipeline YAML"
    data_references:
        sampleDS:
            datastore: workspaceblobstore
            path_on_datastore: path/of/sampeDS/sample.csv

最佳答案

是的,你说得对。 TabularDataset 不支持下载或挂载。您可以创建并注册一个文件数据集,代码示例将起作用。 了解有关数据集类型的更多信息 here

关于Azure机器学习: Creating ML Pipeline from YAML fails: TabularDataset does not support mount.仅FileDataset支持挂载,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63796488/

相关文章:

c# - Azure - AD - AcquireTokenSilent 给出错误 failed_to_acquire_token_silently

php - 输入凭据后,Azure AD OAuth2 重定向回 Microsoft 登录

azure - DocumentDB REST API : x-ms-documentdb-partitionkey is invalid

azure - 如何在 Azure 机器学习服务中启用 ACI Web 服务的身份验证?

python-3.x - 如何在 azure 机器学习工作室中保存和访问 pickle/hdf5 文件

azure - windows azure虚拟机硬盘已满

yaml - Conda 环境导出到 yaml 文件失败

java - 将 application.conf 隐藏到 application.yaml

ruby - I18n.t 翻译缺少默认值 Nil

azure - 从 Azure Blob 存储到计算目标的数据传输速度缓慢