python - 如何以表格格式写入字典数据

标签 python

如何以下表输出格式写入下表数据?

字典列表

data=[{'date': datetime.date(2011, 2, 8), 'user': u'xxx', 'status': u'P'}, {'date': datetime.date(2011, 2, 8), 'user': u'yyy', 'status': u'P'}, {'date': datetime.date(2011, 2, 8), 'user': u'zzz', 'status': u'P'}, {'date': datetime.date(2011, 2, 9), 'user': u'xxx, 'status': u'P'}, {'date': datetime.date(2011, 2, 9), 'user': u'yyy', 'status': u'E'}, {'date': datetime.date(2011, 2, 9), 'user': u'zzz', 'status': u'E'}, {'date': datetime.date(2011, 2, 10), 'user': u'xxx', 'status': u'P'}, {'date': datetime.date(2011, 2, 10), 'user': u'yyy', 'status': u'P'}, {'date': datetime.date(2011, 2, 10), 'user': u'zzz', 'status': u'P'}]

输出格式应该是:

S.no  user  2011-02-08 2011-02-09 2011-02-10  p-total E-total total 
 1    xxx      p          p         p           3       0       3
 2    yyy      p          E         p           2       1       3
 3    zzz      p          E         E           1       2       3

需要帮助

最佳答案

我对写这样的答案有点矛盾 - 它似乎只是提供了一个完整的解决方案,几乎没有教学值(value),但我已经尽力让它尽可能地有用......

如果我理解您正在尝试正确执行的操作,您希望将您的 data 转换为 CSV 格式,其中每个用户各占一行。有一系列日期,您希望每个日期都有一列 - 该列表示用户在该日期的状态。然后有列生成每个日期每个状态的总计,等等。您引用的输出看起来最像带有制表符作为分隔符的 CSV,尽管正如 eumiro 指出的那样,事实并非如此。但是,假设您要编写制表符分隔的数据。如果您在 data 中发现用户一天有两种不同的状态,您的问题并不清楚应该发生什么,所以让我们检查一下并抛出异常。

请注意,最后一段中的所有内容都应该包含在您的问题中,连同您迄今为止最佳尝试的代码。

因此,使用 csv 模块中的 DictWriter 是一个合理的想法,但要使用该类,您需要为每一行创建一个字典,将列标题映射到值。因此,您可以遍历 data 中的所有内容以生成字典字典,将用户映射到表示该用户行的字典。你可以用这样的东西来做到这一点:

from collections import defaultdict
import csv
from datetime import date

user_to_row = defaultdict(dict)

for d in data:
    user = d['user']
    status = d['status']
    row_dict = user_to_row[user]
    row_dict['user'] = user
    date_string = str(d['date'])
    if date_string in d and row_dict[date_string] != status:
        raise Exception, "Contradiction: '%s' on '%s'" % (user,date_string)
    row_dict[date_string] = status
    # If a value isn't set in one of the total columns yet, set it to 0:
    row_dict.setdefault('p-total',0)
    row_dict.setdefault('E-total',0)
    row_dict.setdefault('total',0)
    # Make sure you increment the right column:
    count_column = 'p-total' if (status == 'P') else 'E-total'
    row_dict[count_column] += 1
    # And increment the overall total column in any case:
    row_dict['total'] += 1

您应该检查您是否了解其中发生的事情 - 尝试打印 user_to_row 以检查您是否了解正在生成的内容。

现在您只需要循环遍历 user_to_row 字典中的值并使用 DictWriter 输出它们。这里要注意的是,您不确定每个日期都会有一个条目,所以在这种情况下,我只是在缺少值时插入了 Unknown:

with open("hello.csv","w") as f:

    # Create the headings:
    headings = ['S.no']
    headings += [str(date(2011,2,i)) for i in xrange(6,11)]
    headings += ['user', 'date_format','p-total','E-total','total']

    writer = csv.DictWriter(f, headings, delimiter="\t")

    # The writeheader method only appeared in Python 2.7, so write the
    # headings from a dictionary that maps each heading to itself:
    writer.writerow(dict(zip(headings,headings)))

    # Assume that S.no is just a row number...
    sno = 1
    for d in user_to_row.values():
        d['S.no'] = sno
        # Fill in any unknown values with 'Unknown':
        for h in headings:
            d.setdefault(h,'Unknown')
        writer.writerow(d)
        sno += 1

csv module 的文档应该为您提供理解该部分所需的所有额外信息。

输出结果如下:

S.no    2011-02-06  2011-02-07  2011-02-08  2011-02-09  2011-02-10  user    date_format p-total E-total total
1   Unknown Unknown P   P   P   xxx Unknown 3   0   3
2   Unknown Unknown P   E   P   yyy Unknown 2   1   3
3   Unknown Unknown P   E   P   zzz Unknown 2   1   3

...由于选项卡,这里看起来很奇怪,但会正确加载到电子表格中。

关于python - 如何以表格格式写入字典数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5243623/

相关文章:

python - 对字符串 Python 进行计数操作的计算成本是多少?

python - 将范围与 for/in 一起使用

python - 如何在 Python 2.5.1 的备用安装中启用 OpenSSL 支持?

python - 如何使用 Seaborn 热图设置固定颜色范围?

python - 如何在 Ubuntu 12.04 Precise 上正确安装 GTK+?

python - 使用 GridSearchCV 在 CV 期间内部缩放训练数据以进行超参数优化

python - python中的全局变量引用

python - 如何使 FigureCanvas 适合面板?

python - 构建Docker镜像时无法安装要求

python - Kivy - 检查当前是否显示弹出窗口(因为 Kivy 弹出窗口不是真正的模态(后退按钮/键盘))