我将文件 a.csv
排序为 b.csv
。
我注意到文件的大小不同,并且在注意到 b.csv
恰好小于 n
个字节(其中 n
是a.csv
中的行数),我立即怀疑 a.csv
包含那些讨厌的 \r
。
用于排序的 .py
脚本包含 line.strip()
行,它删除了回车符,然后是 afile.write(line2 + '\n ')
写换行符但不写回车符。
好的。有道理。
奇怪的是,当我 vim
'd a.csv
时,我没有像往常那样看到 ^M
(可能原因在于配置文件),所以我只是在十六进制编辑器中打开文件才发现\r
。
更有趣的是,我会取一小部分 a.csv
(3y
) 并将其粘贴到测试文件 (p
)。
对测试文件进行排序后,文件的大小与原始文件完全相同。
从xxd
ing,我看到新的testfile中没有\r
。
当我拉出包含回车的行并将其粘贴到另一个文件中时,粘贴的行不包含回车。为什么?
我在 Windows (Cygwin) 上对此进行了测试,它似乎确实复制了 \r
。但在我使用的 Linux 机器上,它没有。
怎么会?
编辑:
我尝试在另一台 linux 机器上重现该问题,但我不能。它似乎是一个配置的东西 - 某个地方的某个文件告诉 vim 这样做。
最佳答案
Vim 的加载文件模型是一系列行,每行由一系列字符组成。在这个模型中,换行符本身并不是字符。因此,当您复制文本行时,您不是在复制 CR 或 LF。 Vim 还存储了许多其他信息,这些信息用于再次写回文件,主要是:
fileformat
可以是 unix
、dos
或 mac
。这决定了将在每行末尾写入的行尾字符。
endofline
可以打开或关闭。这将确定文件的最后一行是否有行尾字符。
bomb
可以打开或关闭。这决定了是否在第一行的开头写入字节顺序标记。
fileencoding
指定将使用什么字符编码来存储文件,例如 utf-8
。
通常这些都是在加载文件时自动检测到的。特别是,fileformat
将根据 fileformats
选项中的设置自动检测,在不同平台上可能配置不同。但是,有时事情可能会出错。最常见的问题是文件可能有混合的行尾,这就是您开始看到 ^M
float 的时候。在这种情况下,Vim 已将文件加载为 unix 格式 - 它将 LF 视为行分隔符,将 CR 视为普通字符。你可以通过输入 :set fileformat?
或简写 set ff?
来查看 Vim 以哪种模式打开文件。
关于vim - 当我将一行复制到另一个文件时,为什么vim会剥离回车?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34939473/