最佳答案
使用以下代码,您现在只需分隔数据框 df
的列(您可以使用 Excel 来实现):
library(pdftools)
library(tidyverse)
text <- pdf_text("consolidated transfer orders.pdf")
df <- map_dfr(1:length(text),
~ str_extract_all(text[.x],"(?<=\\n\\s{1,3})\\d+\\s+(.*)") %>%
unlist() %>% data.frame())
关于r - 在 pdf、单个表、r 中解析跨多个页面的表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/69614885/