azure - 如何使用 Azure ML 创建的标签在语言认知服务中训练自定义模型?

标签 azure nlp azure-cognitive-services azure-machine-learning-service

对于一个项目,我想使用 Azure 机器学习的标记环境来标记命名实体和分类。我想使用这些标签通过 Azure 语言认知服务来训练自定义 NER 和自定义文本分类模型。我之所以想使用Azure ML中的标签环境,而不是Azure语言认知服务本身的标签工具,是因为尤其是文本分类标签在Azure ML中方便得多。

根据我在 documentation 中读到的内容Azure ML 将这些标签导出到“带标签的 Azure 机器学习数据集 (v1)”、CSV 文件(对于文本分类标签)或 CoNLL 文件(对于 NER 标签)。但是,要在 Azure 语言认知服务中训练自定义 NER 或文本分类模型,我只能将标记数据作为 json 文件导入 this format for text classification 中。和 this format for NER 。有没有办法将标签从 Azure 机器学习导出为 json 文件?如果没有,有人知道如何将Azure机器学习数据集转换为json文件吗?

谢谢!

最佳答案

使用执行Python脚本或执行R脚本模块,我们可以从JSON导入数据。将使用执行 R 脚本模块。 将使用执行 R 脚本模块。在 Azure ML Studio 中,此模块用于运行 R 脚本代码。 执行 R 脚本模块有三个输入参数。它们是脚本包、数据集 1 和数据集 2。您可以借助 Dataset1 和 Dataset2 输入将数据导入到执行 R 脚本模块中。包含多种文件类型的 zip 文件可与脚本包端口一起使用。为了加载 JSON,我们将利用此脚本包端口。

enter image description here

我们将逐步将压缩的 JSON 文件导入 Azure ML。考虑这样的场景:我们想要使用 JSON 数据文件作为 Azure ML 的数据集。从 JSONPlaceholder 下载示例 JSON 数据后,您必须压缩此 JSON 文件。

enter image description here

在 Azure ML Studio 中选择“数据集”选项卡,然后单击底部的 (+) 新建。

enter image description here

从本地文件中选择 选择“为新数据集选择一个类型作为 Zip 文件”选项以及压缩 JSON 文件的路径。

enter image description here

您将收到“SampeJSONData.zip”数据集上传已完成的消息,并且 SampleJSONData 文件将显示在“我的数据集”页面上。

enter image description here

选择“实验”选项卡并单击“(+) 新建”。

enter image description here

选择任何空白实验选项,然后创建一个新实验。 找到 SampleJSONData.zip,然后将其拖到设计面板。

enter image description here

拖放执行 R 脚本模块。 将执行 R 脚本模块脚本包端口连接到 SampeJSONData.zip 输出。

enter image description here

将此查询粘贴到 Rscript 框中。

library(jsonlite)
myjsondata <-   fromJSON("src/posts.txt")
maml.mapOutputPort ("myjsondata");

enter image description here

运行实验,然后右键单击执行 R 脚本模块的结果数据集端口并选择可视化

enter image description here

enter image description here

我们从 zip 文件中提取 JSON 数据,并将其转换为可在 Azure ML 中使用的格式 实验。现在任何网站都可以向我们提供 JSON 数据。

其实,前面的演示和这个选择很相似。使用此选项仅更改 JSON 数据文件的源。以前,我们有一个 zip 文件,但对于本示例,我们将在网站上使用 JSON 数据。 修改R脚本模块代码:

library(jsonlite)
myjsondata  <-  fromJSON("https://jsonplaceholder.typicode.com/posts ")
maml.mapOutputPort("myjsondata");

运行

enter image description here

当您可视化 R 脚本模块的结果数据集时,您可以看到它获取 JSONPlaceholder 发布 JSON 数据。 下图中我们可以看到 JSON 形式和可视化形式的比较。

enter image description here

关于azure - 如何使用 Azure ML 创建的标签在语言认知服务中训练自定义模型?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/74729192/

相关文章:

Azure 网站、Cname 重定向、SEO

Azure 存储模拟器 400 错误请求

azure - cosmos 中的多个 order by

azure - 无法在 Azure Synapse Studio 中创建用户定义的函数

nlp - 给定 100,000 个单词到音素的映射,如何在音素边界上分割原始单词?

python - 我如何在整个 Penn Treebank 语料库上训练 NLTK?

Python SDK Azure 计算机视觉 : 'bytes' object has no attribute 'read'

python - 如何处理预训练 Glove 词嵌入中看不见的单词以避免按键错误?

python - 如何为 Microsoft Azure 声音赋予不同的风格?

azure - 使用 Microsoft Azure Text To Speech with Unity 时,播放声音的开头和结尾会出现断音