我正在尝试探索 Apache Drill。我不是数据分析师,只是基础设施支持人员。我看到关于 Apache Drill 的文档太有限了
我需要一些关于可与 Apache Drill 一起使用的自定义数据存储的详细信息
- 是否可以像 dfs 一样使用 Apache Drill 在没有 Hive 的情况下查询 HDFS
- 是否可以查询像 MySQL 和 Microsoft SQL 这样的旧 RDBMS
提前致谢
更新:
我的 HDFS 存储防御说错误(无效的 JSON 映射)
{
"type":"file",
"enabled":true,
"connection":"hdfs:///",
"workspaces":{
"root":{
"location":"/",
"writable":true,
"storageformat":"null"
}
}
}
如果我替换 hdfs:///
与 file:///
,它似乎接受了它。
我从文件夹中复制了所有的库文件
<drill-path>/jars/3rdparty to <drill-path>/jars/
无法使其工作。请帮忙。我根本不是开发人员,我是 Infra 人员。
提前致谢
最佳答案
- Yes.
Drill 直接根据元数据识别文件的模式。请参阅链接以获取更多信息 -
https://cwiki.apache.org/confluence/display/DRILL/Connecting+to+Data+Sources
- Not Yet.
虽然有一个 MapR 驱动程序可以让您实现相同的目标,但现在 Drill 并不支持它。围绕这个问题进行了多次讨论,可能很快就会出现。
关于mysql - Apache Drill - 查询 HDFS 和 SQL,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28765537/