我正在尝试阅读 Census' Geographic Boundary Change Notes 。正如在超链接中所看到的,该文件是一个 K x 11 表格。一个pipe-delimited text version可通过该页面上的链接获取。
我尝试手动将管道分隔文本版本保存为 .txt 文件(例如 foo.txt),然后通过以下方式将其作为管道分隔表读取:
data <- read.table("foo.txt", sep="|")
但是,这会产生错误:
Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, : line 177 did not have 11 elements
当我向下滚动到我认为的第 177 行时,我没有看到任何丢失的内容。因此,我查看了原始文本以了解潜在的问题,其中一个问题是管道看起来没有分隔各个行 - 即没有任何指示符表明我们位于原始 .txt 中表行的末尾文件。然而,这似乎与 read.table() 期望 11 个对象的事实相矛盾。
我需要在 .txt 文件中添加与表格每行末尾相对应的分隔符吗?
如果是这样,我该如何在不手动添加分隔符的情况下执行此操作?
如果这不是问题,我们深表歉意。
最佳答案
分隔没有问题。我改为下载 .txt 文件并使用“|”在 Microsoft Excel 中打开它作为分隔符。向下滚动到存在问题的行,似乎是西类牙字符引起了问题。
关于R:当每行末尾未分隔时读取分隔表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38449411/