r - 使用 R 内核在 Azure ML Notebook 中创建数据框

标签 r dataframe azure azure-machine-learning-service azuremlsdk

我已经在 R 中编写了一些脚本,我必须在 azure ml 笔记本中运行这些脚本,但我没有找到太多文档如何通过在具有 R 内核的笔记本中运行代码来创建数据集。我编写了以下与 python 内核一起使用的 python 代码:

from azureml.core import Dataset, Datastore,Workspace

subscription_id = 'abc'
resource_group = 'pqr'
workspace_name = 'xyz'

workspace = Workspace(subscription_id, resource_group, workspace_name)
datastore = Datastore.get(workspace, 'workspaceblobstore')

# create tabular dataset from all parquet files in the directory
tabular_dataset_3 = Dataset.Tabular.from_parquet_files(path=(datastore,'/UI/09-17-2022_125003_UTC/userdata1.parquet'))

df=tabular_dataset_3.to_pandas_dataframe()

它与 python 内核配合得很好,但我想在带有 R 内核的笔记本中执行等效的 R 代码。

谁能帮我看看等效的 R 代码是什么?任何帮助将不胜感激。

最佳答案

要创建 R 脚本并使用数据集,首先我们需要将数据集注册到门户。将数据集添加到门户后,我们需要获取数据集 URL 并打开笔记本并使用 R 内核。

enter image description here

上传数据集并获取数据源URL

enter image description here

转到机器学习工作室并创建一个新笔记本。

使用下面的 R 脚本获取数据集并将其转换为数据帧。

azureml_main <- function(dataframe1, dataframe2){
  print("R script run.")
  run = get_current_run()
  ws = workspacename
  dataset = azureml$core$dataset$Dataset$get_by_name(ws, “./path/insurance.csv")
  dataframe2 <- dataset$to_pandas_dataframe()
  # Return datasets as a Named List
  return(list(dataset1=dataframe1, dataset2=dataframe2))
  
}

关于r - 使用 R 内核在 Azure ML Notebook 中创建数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/73756301/

相关文章:

python - 在Python中快速加载和查询数据

azure - Azure DevOps 管道中的 "Job is pending"消息

r - 在 R 中呈现线性回归模型的调节效应时如何反转对数变换?

r - R中按组匹配不同数据集中的值

java - python 的 DataFrame 类结构在 java 中有哪些选项?

pandas - dask 如何定义并行操作并返回具有不同形状的数据帧的自定义(时间折叠)函数

powershell - Azure Powershell 模板 : return Boolean if all resource provisioned successfully?

.net - Azure 服务总线将获取请求添加到队列

r - 仅在使用 R Markdown 在投影仪中暂停后才显示脚注

string - 用 Latex 代码替换字符串向量中的重音符号