当前分类:amazon-emr

hive - 使用符号链接(symbolic link)格式 list 对 Delta Lake 表进行 Spark SQL 查询

pyspark - Jupyter Notebook PySpark 内核引用主机站 pip 包中降低的 pip 版本

apache-spark - 与文件路径列表相比,为什么 Spark 读取目录的速度要快得多?

amazon-s3 - 将目录作为压缩文件从 Elastic MapReduce 上传到 S3

python - 在 Hadoop MapReduce 脚本中导入外部库

hadoop从hdfs复制到S3

amazon-web-services - 将 DynamoDB 表导出到 S3 存储桶 : No subnet found in default VPC. 至少需要一个子网

hadoop - Spark saveAsTextFile 创建目录

amazon-web-services - 在 AWS EMR 上配置 Presto 的内存分配时出现问题

amazon-web-services - AWS EMR Spark : Error writing to S3 - IllegalArgumentException - Cannot create a path from an empty string

apache-spark - 具有多个加密 key 提供商的 EMR

apache-spark - EMR 中的 yarn 容器、Spark 执行器和可用节点之间有什么关系?

apache-spark - AWS EMR Spark 作业重新启动 [AsyncEventQueue : Dropping event from queue appStatus. ]

libraries - 将库添加到 EMR 上 Jupyter/JupiterHub 上的 PySpark 内核

apache-spark - 如何通过 Spark SQL 连接 BigQuery?

scala - 在 EMR 笔记本上安装其他 scala 库

apache-spark - 如果 emr 上的 Spark 中不存在存储桶,如何阻止创建存储桶

apache-spark - 增加 Jupyter/Livy 中的 Spark 应用程序超时

python - 如何在 Airflow EmrCreateJobFlowOperator 中设置 job_flow_overrides 的动态名称?

amazon-web-services - 如何将 boto3 安装到 EMR 集群上以与 Jupyter Notebook 一起使用

热门标签: