r - 行尾的额外逗号导致 read.csv 和 read.table 出错

标签 r read.table read.csv

我正在尝试阅读此 .csv file到 R。当我使用 read.csv 时,我要么得到与 row.names 相关的错误,要么列名与其原始列有偏移。基于 this post我相信问题与每行末尾有一个额外的逗号有关。我在对上一个问题的回答中找不到的是如何去掉行尾逗号。

我的工作是执行以下操作:

pmr <-read.csv("pubmed_result.csv", header = T, row.names = NULL)
colnames(pmr) <- c(colnames(pmr)[2:ncol(pmr)], "blank")
pmr <- pmr[1:ncol(pmr)-1]

这提供了所需的结果,但似乎有点不雅。有没有办法让 read.csv 或 read.table 忽略最后一个逗号?或者有没有办法使用gsub来修复csv?

最佳答案

您的评估是正确的,尾随 ","导致问题。准确地说,事实是您有一个尾随 ","在数据行中,但不在声明列名的行中。

如果您不想像在上面的代码中那样手动修复问题,您可以使用 readr::read_csv

library(tidyverse);
df <- read_csv("pubmed_result.csv");
df;
    ## A tibble: 375 x 11
#   Title   URL    Description  Details  ShortDetails Resource Type  Identifiers
#   <chr>   <chr>  <chr>        <chr>    <chr>        <chr>    <chr> <chr>
# 1 Myoedi… /pubm… Zhang Y, Lo… Physiol… Physiol Rev… PubMed   cita… PMID:29717…
# 2 Cullin… /pubm… Papizan JB,… J Biol … J Biol Chem… PubMed   cita… PMID:29653…
# 3 Fusoge… /pubm… Bi P, McAna… Proc Na… Proc Natl A… PubMed   cita… PMID:29581…
# 4 Correc… /pubm… Long C, Li … Sci Adv… Sci Adv.  2… PubMed   cita… PMID:29404…
# 5 Single… /pubm… Amoasii L, … Sci Tra… Sci Transl … PubMed   cita… PMID:29187…
# 6 Requir… /pubm… Shi J, Bi P… Proc Na… Proc Natl A… PubMed   cita… PMID:29078…
# 7 Consid… /pubm… Carroll KJ,… Circ Re… Circ Res.  … PubMed   cita… PMID:29074…
# 8 ZNF281… /pubm… Zhou H, Mor… Genes D… Genes Dev. … PubMed   cita… PMID:28982…
# 9 Functi… /pubm… Kyrychenko … JCI Ins… JCI Insight… PubMed   cita… PMID:28931…
#10 Defici… /pubm… Papizan JB,… J Clin … J Clin Inve… PubMed   cita… PMID:28872…
## ... with 365 more rows, and 3 more variables: Db <chr>, EntrezUID <int>,
##   Properties <chr>

这将引发一堆警告,这些警告源自缺少/附加​​的尾随“,”,在这种情况下您可以忽略它们。请注意,列名已正确分配。

关于r - 行尾的额外逗号导致 read.csv 和 read.table 出错,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50979239/

相关文章:

r - 将置信区间添加到分位数回归的样条曲线

r - 如何用ggplot2制作哑铃图?未正确绘制 R

read.table() 错误,即使所有元素都存在

R:读取 .csv 将所有 ""(空格)变为 NA

r - 在 S4 或引用类中调用多个槽或字段

读入文件 - 警告消息

R read.csv 如何忽略回车?

r - 在 R Studio 中从 csv 加载的行数有限

r - 线性混合建模可以处理响应变量和/或预测变量中的 NA(缺失数据)吗?