c++ - 在 C/C++ 中使用二进制搜索在日志文件中搜索日期时间

标签 c++ c binary-search log4cpp

我有一些log4cpp格式的日志文件

--根据log4cpp的性质,这个文件在每一行的开头是按照日期时间排序的

假设格式是这样的

2012-09-02 17:17:36.891 This is line 1 in file 2   
...
2013-08-05 14:17:35.344 This is line 607082 in file 2
2013-08-05 14:17:36.891 This is line 607083 in file 2
...
2013-09-05 14:27:36.891 This is line 934594 in file 2

现在我正在编写一个程序来解析这些文件并尝试快速定位到一行。

例如,如果我运行

./my_program -start_time "2013-08-05 14:17:36"file_2.txt

我希望这个程序可以返回 607083 作为结果。

此外,-start_time 可以基于其他粒度,例如“2013-08-05 14:17:35.899”或“2013-08-15”,但我期待最接近的结果。

我可以逐行遍历这个文件,并在每一行的开头比较时间戳(只需使用字符串比较),但需要 O(N) 时间。我已经实现了它并发现如果在开始时跳过数百万行它真的很慢。

我想知道我们是否可以为此使用二进制搜索。我认为这是返回最近结果的最佳方式,并且只需要 O(lgN) 时间

最佳答案

是的,你可以。这是按日期排序的日志。为什么不取第一行和最后一行,它们应该是最近的和最近的最后一个日期。

您可以制作一个将日期转换为秒数的函数。在第一次调用时,转到日志的中间并检查你的日期是更大还是更小等等......(二进制搜索)

希望这会有所帮助,并希望我对这将如何工作的解释清楚

关于c++ - 在 C/C++ 中使用二进制搜索在日志文件中搜索日期时间,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19709587/

相关文章:

c++ - 套接字服务器无法接收客户端发送的消息

python - 绝对元素和

c++ - 我试图在 char 数组的中间添加一个空格。不确定如何正确移动它

c++ - 如何将字符变量存入二维字符变量

c++ - 使用 C/C++ 打开和编辑 SVG 文件

C: 解释 if(exit(0),0){} 行代码

c++ - 当包含 SDL 时,简单的 tcp echo 程序不工作?

c++ - 线程堆栈错误

python - 使用 python 在大型 .txt 中进行二进制搜索(按哈希排序)

search - 搜索字符串算法