我已经在 R 中编写了一些脚本,我必须在 azure ml 笔记本中运行这些脚本,但我没有找到太多文档如何通过在具有 R 内核的笔记本中运行代码来创建数据集。我编写了以下与 python
内核一起使用的 python 代码:
from azureml.core import Dataset, Datastore,Workspace
subscription_id = 'abc'
resource_group = 'pqr'
workspace_name = 'xyz'
workspace = Workspace(subscription_id, resource_group, workspace_name)
datastore = Datastore.get(workspace, 'workspaceblobstore')
# create tabular dataset from all parquet files in the directory
tabular_dataset_3 = Dataset.Tabular.from_parquet_files(path=(datastore,'/UI/09-17-2022_125003_UTC/userdata1.parquet'))
df=tabular_dataset_3.to_pandas_dataframe()
它与 python 内核配合得很好,但我想在带有 R 内核的笔记本中执行等效的 R 代码。
谁能帮我看看等效的 R 代码是什么?任何帮助将不胜感激。
最佳答案
要创建 R 脚本并使用数据集,首先我们需要将数据集注册到门户。将数据集添加到门户后,我们需要获取数据集 URL 并打开笔记本并使用 R 内核。
上传数据集并获取数据源URL
转到机器学习工作室并创建一个新笔记本。
使用下面的 R 脚本获取数据集并将其转换为数据帧。
azureml_main <- function(dataframe1, dataframe2){
print("R script run.")
run = get_current_run()
ws = workspacename
dataset = azureml$core$dataset$Dataset$get_by_name(ws, “./path/insurance.csv")
dataframe2 <- dataset$to_pandas_dataframe()
# Return datasets as a Named List
return(list(dataset1=dataframe1, dataset2=dataframe2))
}
关于r - 使用 R 内核在 Azure ML Notebook 中创建数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/73756301/