python - 使用 Python 解析 Thread-Index 邮件头

标签 python email-headers

一些邮件客户端,不设置References headers,而是设置Thread-Index

有没有办法在 Python 中解析这个 header ?

相关:How does the email header field 'thread-index' work?

邮件 1

Date: Tue, 2 Dec 2014 08:21:00 +0000
Thread-Index: AdAOBz5QJ/JuQSJMQTmSQ8+dVs2IDg==

邮件 2(与邮件 1 相关)

Date: Mon, 8 Dec 2014 13:12:13 +0000
Thread-Index: AdAOBz5QJ/JuQSJMQTmSQ8+dVs2IDgE4StZw

更新

我希望能够在我的应用程序中链接这两封邮件。它已经完美地适用于众所周知的 ReferencesIn-Reply-To header 。

最佳答案

使用信息here , 我能够将以下内容放在一起:

import struct, datetime

def parse_thread_index(index):

    s = index.decode('base64')

    guid = struct.unpack('>IHHQ', s[6:22])
    guid = '{%08X-%04X-%04X-%04X-%12X}' % (guid[0], guid[1], guid[2], (guid[3] >> 48) & 0xFFFF, guid[3] & 0xFFFFFFFFFFFF)

    f = struct.unpack('>Q', s[:6] + '\0\0')[0]
    ts = [datetime.datetime(1601, 1, 1) + datetime.timedelta(microseconds=f//10)]

    for n in range(22, len(s), 5):
        f = struct.unpack('>I', s[n:n+4])[0]
        ts.append(ts[-1] + datetime.timedelta(microseconds=(f<<18)//10))

    return guid, ts

给定一个线程索引,它返回一个元组 (guid, [list of dates])。对于您的测试数据,结果是:

 > parse_thread_index('AdAOBz5QJ/JuQSJMQTmSQ8+dVs2IDgE4StZw')
('{27F26E41-224C-4139-9243-CF9D56CD880E}', [datetime.datetime(2014, 12, 2, 8, 9, 6, 673459), datetime.datetime(2014, 12, 8, 13, 11, 0, 807475)])

我手头没有足够的测试数据,所以这段代码可能有问题。请随时告诉我。

关于python - 使用 Python 解析 Thread-Index 邮件头,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27374077/

相关文章:

python - 尝试创建没有重叠的 Sprite

python - 在 Python 3 中使用 RSA,需要对消息进行签名(不对消息进行哈希处理)

python - 将 TextField() 迁移到 JSONField()

python - 我怎样才能以编程方式将笔记发布到 Google 阅读器?

python - 保留 Python 字符串的第一个字?

java - 通过电子邮件标题检测电子邮件正文语言的可能性

email - Mailchimp:从标题中删除 mcsv.net

php - 什么是 ZuckMail?

php - mail() 来自 php.net 手册 : difference between "to" and "to-header"

ruby - 使用最大行长度简洁地序列化 JSON