我尝试将文件从 NORDPOOL.COM 下载到 R 中,但不知何故 xls 格式正在变成一种奇怪的格式
我尝试了不同的文件格式,但 read.table 是唯一提供有意义表格的文件格式
df <- read.table("https://www.nordpoolgroup.com/globalassets/marketdata-excel-files/regulating-prices_2019_hourly_dkk.xls")
我正在寻找一个看起来像 excel 文件的数据框....
最佳答案
rvest
可能会有所帮助,
library(rvest)
page <- read_html("https://www.nordpoolgroup.com/globalassets/marketdata-excel-files/regulating-prices_2019_hourly_dkk.xls")
out <- page %>% html_node("table") %>% html_table()
out <- out[-c(1,2,3,4),c(1,2,23,24,25,26)]
colnames(out) <- c("Date","Hour","DK1_Up","DK1_Down","DK2_Up","DK2_Down")
head(out)
Date Hour DK1_Up DK1_Down DK2_Up DK2_Down
5 01-01-2019 00 - 01 211,45 211,45 211,45 211,45
6 01-01-2019 01 - 02 75,19 75,19 75,19 75,19
7 01-01-2019 02 - 03 -30,46 -30,46 -30,46 -30,46
8 01-01-2019 03 - 04 -73,99 -73,99 -73,99 -73,99
9 01-01-2019 04 - 05 -55,33 -55,33 -55,33 -55,33
10 01-01-2019 05 - 06 -93,71 -93,71 -93,71 -93,71
但是,它是 不规则数据,要整理它,你必须看看
.xls
的内部文件。那是我实际上所做的。所以我认为,在下载文件并进行必要的安排后,阅读 R
中的文件与 rvest
相比仍然是一个不错的选择.
关于r - 导入excel文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57546778/