我正在尝试了解如何使用 Microsoft Azure 机器学习笔记本连接到 SQL Server 和 Azure SQL 数据库。
我知道如何使用 ODBC 连接将常规 Jupyter 文件连接到 SQL Server 数据库。但是,在使用 Azure 机器学习笔记本时,我似乎必须尝试一些不同的东西。
有人可以描述实现此目的的最佳方法吗?
注意:我指的是新的 Microsoft Azure 机器学习服务,截至 2020 年 5 月,该服务目前处于预览模式。
最佳答案
很好的问题——答案取决于您的数据源是否在 Azure 中。
Azure 中的数据
对于基于 Azure 的存储(blob、数据湖、Azure SQL、Azure Databricks),你幸运地使用了 Azure ML Datasets
,以及在 azureml-dataprep
之上的抽象>,azureml-sdk
的组件包。恕我直言,Azure ML Datasets
很漂亮,TabularDatasets
特别是他们的 to_pandas_dataframe()
和 .to_spark_dataframe()
方法。
查看以下文章以获取有关如何操作的指南:
- How to connect to data and register as a
Dataset
- How to access data during training
按照本教程中的建议创建一个
TabularDataset
FileDataset
数据不在 Azure 中
对于本地或 IaaS SQL 服务器,我知道有两个选项:
- 将您的 SQL 服务器放在 Azure ML 服务和 ComputeTarget 的同一网络中,并使用
pyodbc
库直接访问服务器。 - Use ADF to move the SQL server data to Azure Storage ,(您需要在 SQL 服务器上安装 ADF 集成运行时)
关于sql-server - 如何使用 Azure 机器学习笔记本连接到 SQL Server 和 Azure SQL 数据库?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61665927/