azure - Databricks - 从文件夹中读取 CSV 文件

标签 azure databricks

dbfs:/FileStore/shared_uploads/prasanth/Company.csv中选择*

我正在尝试从 azure 数据 block 中的文件夹中选择记录,但我面临着这个问题 错误 SQL语句:AnalysisException:找不到表或 View

最佳答案

我重现了这个错误。

enter image description here

databricks SQL 中没有之前以该名称创建的表或 View 时,会发生此错误。 在上面,您尝试查询 dbfs:/filepath.csv,它不是 Databricks SQL 中的表或 View 。

要在 databricks SQL 中访问 dbfs 文件,首先我们需要为其创建一个表或 View ,并将 csv 文件数据复制到其中。然后我们可以查询该表。

代码:

%sql
/*Table creation with schema*/
CREATE OR REPLACE TABLE  table1
( 
Id int,Name varchar(32),Age int,marks int
);

/*Copying dbfs csv data into table*/
copy into table1
  from "dbfs:/FileStore/tables/mycsv2.csv"
  FILEFORMAT = csv
  FORMAT_OPTIONS('header'='true','inferSchema'='True');

select * from table1;

我的执行:

enter image description here

另一种替代方法(在 databricks SQL 中查询 csv)可以使用 pyspark 或 scala dataframe,如上面 @ASH 所建议的。

读取 csv 文件,然后创建临时 View 。

代码:

%python
spark_df=spark.read.csv("dbfs:/FileStore/tables/mycsv2.csv",header=True)
#Creating temporary view for the dataframe.
spark_df.createOrReplaceTempView("mycsvview1")

%sql
select * from mycsvview1;

输出供您引用:

enter image description here

关于azure - Databricks - 从文件夹中读取 CSV 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/74153955/

相关文章:

c# - 在 Controller 级别将自定义属性添加到遥测请求

azure - 如何在ADLS中存储databricks集群日志

azure - 使用 databricks 集群管理身份

azure - Databricks - 将数据从一个databricks工作区传输到另一个databricks工作区

Azure Databricks 和日志分析设置需要重新启动或重建吗?

azure - 使用 Azure DevOps 在订阅之间移动资源

c# - 使用 MVC Controller 将 websocket 连接到 windows azure

azure - 使用 PInvoke 在 Azure Service Fabric 中加载 dll

c# - Blazor - app.UseIdentityServer();使用 .pfx key 文件 - 解析数字时遇到意外字符

python - 如何在 Databricks 中引用笔记本的路径/%run 在做什么?