python - 我可以将 Papermill 和 Scrapbook 与 AWS EMR Notebooks 结合使用吗?

标签 python amazon-web-services jupyter-notebook amazon-emr papermill

我有几个笔记本,它们由使用造纸厂的“驱动程序”笔记本运行。这些笔记本电脑使用剪贴簿库向驾驶员传达信息。然后,驱动程序将此信息作为参数传递给其他笔记本。我想使用 EMR Notebooks 来优化这个“笔记本管道”的执行效率。 AWS EMR Notebooks 是否支持剪贴簿和 papermill,或者我需要重构我的笔记本吗?

最佳答案

到目前为止,还没有。你不能直接这样做。 您可以做的(我们正在做的)如下:

  1. 使用 hadoop 用户在 EMR 主节点上创建 Python 环境
  2. 安装sparkmagic在您的环境中并按照 Sparkmagic 的 README.md 文件中的描述配置所有内核
  3. 将您的笔记本复制到主节点/直接从 s3 位置使用它
  4. 安装 papermill 并使用 papermill 运行:

    papermill s3://path/to/notebook/input.ipynb s3://path/to/notebook/output.ipynb -p param=1

关于python - 我可以将 Papermill 和 Scrapbook 与 AWS EMR Notebooks 结合使用吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59902055/

相关文章:

python - Django order_by字段总和

python - 在 python 中通过按键调用函数的最简单方法(3)

python - Pandas:如何根据多列的条件将值替换为 np.nan

python - AWS Lambda | Azure Python 库集成

python - 无法在 Jupyter Notebook 中导入 Tensorflow

python - Jupyter笔记本电脑: Widget Javascript not detected

python - 使用 python 3 的中间值

android - FCM 能否与 AWS SNS 配合使用?

amazon-web-services - 在没有负载均衡器的情况下将 DNS (Route 53) 路由到 Elastic Beanstalk 应用程序

python-2.7 - 在jupyter中选择python内核