我一直在尝试使用 R 中的 XBRL 包从 sec 网站中分离损益表、 Assets 负债表和现金流数据。理想情况下,我会将这三者输入到单独的数据框中,希望将数据导出到统一的产品中在excel中。
我可以使用以下命令打印出 R 控制台中的语句:
inst <- "http://www.sec.gov/Archives/edgar/data/1223389/000122338914000023/conn-20141031.xml"
options(stringsAsFactors = FALSE)
xbrl.vars <- xbrlDoAll(inst)
xbrl.sec <- xbrlSECdev01(xbrl.vars)
xbrl.sec$showStatements()
但我无法创建一个数据框来保存所有这些信息。
到目前为止,我已经尝试过:
conn.data <- xbrl.sec$showStatements()
不幸的是,这只是再次打印出数据并留下
conn.data
空值。知道如何存储这些数据吗?
“How to take the lists created by xbrlDoAll in the XBRL package in R, and organize them into dataframes readable in Excel? ”去年三月被问到,但没有得到答复。
最佳答案
XBRL package 是复杂 XBRL 文件(XML、模式、XLinks 等)的解析器。结果很简单:一个数据框列表。但它仍然需要对 XBRL 哲学有一定的了解。
您会在 fact
中找到所有数字。 table 。通过加入 context
你会得到时期和具体的维度。要了解它们代表哪些会计概念(现金、库存、流动 Assets 等),您必须加入 element
表也是如此。
元素通常按 3 个链接库分层排列:计算、表示和定义。链接库使用 from-element 和 to-element 字段来定义层次结构和 rule
来区分不同的观点。财务报表通常在演示链接库中描述。
最后 - 使用 label
用于查找概念名称和描述的表(它们直接从元素链接,但可能有更多的标签类型和语言)。
整个事情或多或少是按正确顺序连接表格的练习,所以 dplyr 派上用场了。您可以在 github 上看到我与示例 SEC 文件的斗争。 .
关于r - 使用 R 中的 XBRL 包将财务报表组织成数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27950944/