python - 在不更改 dtype 的情况下将日期时间转换为另一种格式

标签 python python-3.x pandas datetime series

我只是自己学习 Pandas,遇到了一些问题。

  1. 在从 csv 文件读取的 DataFrame 中,我有一列包含不同格式的日期数据(如 '%m/%d/%Y''%Y-%m-%d', 可能为空。)我想统一这一栏的格式。但我不知道是否有其他格式。因此,当我使用 pd.to_datetime() 时,它引发了一些错误,例如格式不匹配和非时间数据。如何统一该栏目的格式?

  2. 我已将该列的一部分转换为 datetime dtype,并且格式为 YYYY-mm-dd。我可以保留日期时间 dtype,并将格式更改为 '%m/%d/%Y' 吗?我已经使用了 pd.dt.strftime(),它会改变格式,但也会将数据类型更改为 str,而不是保留日期时间数据类型。

最佳答案

So when I using pd.to_datetime(),it raised some errors like format not matching and not timelike data. How can I unify the format of this column?

使用 errors='coerce' 选项以便为未转换的值返回 NaT(不是时间)。另请注意,format 参数不是必需的。省略它将使 Pandas 能够尝试多种格式,如果失败它将恢复为 NaT1。例如:

df['datetime'] = pd.to_datetime(df['datetime'], errors='coerce')

请注意,混合类型可能会被错误地解释。例如,Python 如何知道 05/06/2018 是 6 月 5 日还是 5 月 6 日?将应用约定顺序,如果您需要更好的控制,则需要自己应用自定义顺序。

Can I keep the datetime dtype, and change the format into '%m/%d/%Y'?

不,你不能。 datetime 系列在内部存储为整数。任何人类可读的日期表示只是一个表示,而不是基础整数。要访问您的自定义格式,您可以使用 Pandas 中提供的方法。您甚至可以将这样的文本表示形式存储在 pd.Series 变量中:

formatted_dates = df['datetime'].dt.strftime('%m/%d/%Y')

formatted_datesdtype 将是object,这表明您的系列元素指向任意Python 时间。在这种情况下,那些任意类型恰好都是字符串。

最后,我强烈建议您在工作流程的最后一步之前不要datetime 系列转换为字符串。这是因为一旦这样做,您将无法再对此类序列使用高效的矢量化操作。


1 这将牺牲性能并与 datetime.strptime 形成对比,需要指定格式。在内部,Pandas 使用 dateutil库,如 docs 中所示.

关于python - 在不更改 dtype 的情况下将日期时间转换为另一种格式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52027033/

相关文章:

python - 如何在没有 eval 的情况下取消列表/元组的字符串

python - 过滤掉另一列字符串的某一行中包含字符串字段的行

python - 复制pandas数据框中的数据

python - 使用 Python 3.4 在 Textmate 2 中输出错误

python - 当日志在不同进程中发出时,caplog 中的空消息

python - 将文本文件中列出的特定文件从源文件夹复制到目标文件夹

python-3.x - 与协程的双向通信(asyncio 中的状态机)

python - 解析 pandas Dataframe 并根据不同条件应用规则

python - 设置全局输出精度python

python - 如何从 IDLE 中以彩色物理打印 python 代码?