r - 提取部分字符串 : date and times

我有一个通常有一些乱码的变量，例如:

\n\t\n\t\n\t\n\t\tSeuat eselyt\n\t\t\t\t\t\n\t\t\tti 30.07.2019 klo 12 :00 - 14:30\n\t\t\t\t\t\t\tTau 滑雪 2342342 2342342\n\t\t\t\t\t\n\t\n

我正在尝试提取日期 (30.07.2019) 和时间 (12:00 - 14:30)。我不太擅长解析，所以如果能在 R 中实现这一点，我将不胜感激。

最佳答案

如果您可以相信日期和时间部分在您的数据中只出现一次，您可以使用正则表达式来提取它们(此处使用数据框):

library(tidyverse)
data <-
   tibble(gibberish_string = "\n\t\n\t\n\t\n\t\tSeuat eselyt\n\t\t\t\t\t\n\t\t\tti 30.07.2019 klo 12:00 - 14:30\n\t\t\t\t\t\t\tTau ski 2342342 2342342\n\t\t\t\t\t\n\t\n")

data %>% mutate(date = str_extract(gibberish_string,
                                   pattern = "\\d{1,2}\\.\\d{1,2}\\.\\d{4}"),
                time = str_extract(gibberish_string,
                                   pattern = "\\d{1,2}:\\d{1,2}"))

关于r - 提取部分字符串 : date and times，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/57270616/

上一篇：r - 如何测试\是否在字符串中？

下一篇：uwp - AppId 和 Package Id 是否相同？

sql-server - 获取多行的天数

java - 如何在 Java 中从年份字符串创建 SimpleDate

r - 在 R 图中结合 Unicode 进行排版

xml - 如何将带有逗号的xml节点转换为多个节点？

java - 负向后看 Java 正则表达式空间或什么都没有

Javascript 表达式 - 数据提取

r - 如何将数字转换为 hh :mm:ss?

r - 使用多个 geom 时如何消除 ggplotly 重复的图例条目

r - 使用 R 中的匹配子类计算两个国家之间的相关性