hadoop - Apache 钻配置

标签 hadoop apache-drill

我需要为 Apache Drill(基本上是 PSV)添加存储插件,但我找不到可以添加以下行的配置文件:-

 "formats": {
   "psv": {
     "type": "text",
     "extensions": [
       "tbl"
     ],
     "delimiter": "|"
   }
}

请注意,当前在网络浏览器中打开本地主机 url 的解决方案是不可行的。我不想将端口和 IP 暴露给 Internet。目前,我使用双跳 ssh 来访问我的托管钻孔服务器

最佳答案

您可以发布到 Drill 的 REST API:

curl -X POST -H “Content-Type: application/json” -d ‘{ “name”:dfs, “config” {“type”: “file”, "connection": "hdfs:///", “enabled”: true, "workspaces": {"root": {"location": "/", "writable": false, "defaultInputFormat": null}}, "formats": { "psv": { "type": "text", "extensions": [ "tbl" ], "delimiter": "|" }}}’ http://localhost:8047/storage/dfs.json

您还可以创建 bootstrap-storage-plugins.json文件并在启动 Drill 时将其包含在类路径中,并且应在 Drill 启动时加载它。

关于hadoop - Apache 钻配置,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28543747/

相关文章:

hadoop - Apache Drill Query 数据恢复在 HDFS 系统上不是常量

hadoop - 是否有用于 Elasticsearch 的 Apache Drill 存储插件?

java - google appengine mapper - 映射日期范围

postgresql - 你如何让驱动程序和执行程序通过 spark-submit 加载和识别 EMR 中的 postgres 驱动程序?

java - 无法从 MapReduce 代码访问 HBase

python - Apache-Drill 不理解 Pandas datetime64[ns]

java - Apache 钻机 : How to resolve - RESOURCE ERROR: One or more nodes ran out of memory while executing the query?

java - 文件名作为列-hadoop

windows - Windows 上的 Hadoop - "Error JAVA_HOME is incorrectly set."

apache-drill - Apache Drill 与 Kerberos