从压缩文件夹中将 Excel 文件读入 R 数据帧

标签 r xls unzip

我有一个 Excel 文件(.xls 扩展名),它位于一个压缩文件夹中,我想将其作为数据框读取到 R 中。我加载了 gdata 库并将我的工作目录设置为包含压缩文件夹的文件夹.

当我输入以下语法时:

data_frame1 <- read.xls( unz("./Data/Project1.zip","schools.xls"))

我收到以下错误消息:

Error in path.expand(xls) : invalid 'path' argument

Error in file.exists(tfn) : invalid 'file' argument

我猜我在语法中遗漏了一些参数,但我不完全确定还需要包括什么。

感谢您的帮助!这个 R 新手真的很感激!

最佳答案

不幸的是,在快速浏览了我所知道的所有 xls 函数之后,没有可以识别 unz 输出的 xls 读取函数(我很想在这里被证明是错误的)。如果它是一个“csv”,它就可以正常工作。按照目前的情况,在编写这样的函数之前,您必须分两步进行加载提取然后加载。

为了给您更多的控制权,您可以指定要解压缩的文件以及使用 unzip 放置文件的目录。

# default exdir is current directory
unzip(zipfile="./Data/Project1.zip", files = "schools.xls", exdir=".")

dataframe_1 <- read.xls("schools.xls")

遗憾的是,这也意味着如果您不想让“xls”文件四处游荡,您必须事后进行清理。

关于从压缩文件夹中将 Excel 文件读入 R 数据帧,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26763377/

相关文章:

java - 在 Java 中解压 zip 文件会导致 "java.util.zip.ZipException"- 无效的 LOC header (错误签名)

R:阿尔法!他们什么都不做!

python - 如何将 Python Pandas DataFrame 写入具有特定列类型格式的 .XLS 文件?

excel - .Net core读取xls文件

python - os.system ('TASKKILL/F/IM EXCEL.exe' ) 在 python 中

java - ZipInputStream 在提取 zip 文件之前检查它是否有效

c# - 无法将其读取为 .exe 文件 C# 的 ZipFile

R - 矩阵中非对角线元素的最小值、最大值和平均值

r - 如何在R中以hh :mm:ss. 000格式绘制一系列随时间变化的数据?

r - 从 R session 中获取 R session 的 pid(进程 ID)(以附加调试器)