r - csv 文件,或制表符分隔文件,或任何文件

标签 r linux bash csv delimiter

<分区>

我有一个关于文件的问题。

我问的原因是因为使用了一些函数,例如在 R 中将数据从外部导入到 R。

我有一个文件 character_student.txt,其中包含如下数据。

Name, Age, Gender, Test1
john, 11, M, 90
betty, 25, F, 33

我很困惑。以上文件是否被视为 csv 文件(逗号分隔文件)?还是文本文件?使用R将say这个文件导入R时,使用say read.csv(file="character_student.txt)是否合适?

那么我的另一个问题是,如果我有这样的文件:

Name Age Gender Test1
john 11 M 90
betty 25 F 33

所以每个文件之间只有一个空格,然后说我把它保存为.csv文件,那么我认为文件名会变成类似character_text.csv的东西。那么我只是想知道这个文件现在是一个空格分隔文件还是一个逗号分隔文件?

我想我的问题是如何知道我的文件是否为逗号分隔文件?还是以空格分隔的文件?或制表符分隔?

是纯粹根据文件名吗?例如,如果名称以 csv 结尾,那么它是逗号分隔文件,如果它以其他内容结尾,那么它是“其他内容”分隔文件吗?那么文件内部实际是什么样子重要吗?就像我们是否必须打开文件以检查是否有逗号分隔字段以确保该文件是逗号分隔文件?或者如果我们有一个 csv 文件,但在它里面,字段可以用其他东西分隔?

或者如果它被称为 csv,那么里面的每个字段都用逗号分隔(就像我不必打开它来确保它实际上是用逗号分隔一样)?

最佳答案

扩展不定义文件。它们帮助各种实用程序或工具以特定方式处理它们。

您编写一个 python 脚本并将其保存为 hello.c

然后您将它传递给 gcc,例如 gcc hello.c

这没有错。 gcc 将接受处理该文件,但会报告大量语法错误。

同样,通过指定 .csv,您告诉工具、实用程序或函数您正在传递一个逗号分隔的文件。

如果你有这样的文件:

abc def, ghi jkl,

一个用户想从中提取数据,格式如下:

abcdef,ghijkl,。对于那个用户来说,如果他像一个空格分隔的文件一样“对待”它会很好。对于其他一些想要的用户, abc defghi jkl,将其视为逗号分隔文件对他很有用。

对于特定情况,您需要研究该特定功能或工具并分析他们需要该文件的方式。所以,是的,如果一个工具希望文件以特定方式显示,您需要进行检查以相应地将文件传递给该工具。

一切随心所欲。

关于r - csv 文件,或制表符分隔文件,或任何文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57082149/

相关文章:

sql - R: Knitr 给出了 SQL-chunk 的错误

r - R中的列向量到矩阵

linux - 保持 OE/Yocto 图像更新的过程

Bash 守护进程名为 "sh"或 "sleep"不是文件名

r - 不能在类型转换中使用 `fill = NA`

r - 如何访问包含特殊字符或空格的数据表列?

java - 启动java时出现FileNotFoundException

linux - 在嵌入式 Linux 上安全写入紧凑型闪存

linux - 使用 sed/bash 删除左右方括号

linux - 什么时候用引号括起 shell 变量?