python - 在 python 中导出一个 utf-8 csv 文件

标签 python csv encoding pyodbc

我在用 python 导出 utf-8 csv 文件时遇到错误。错误说

AttributeError: 'int' object has no attribute 'encode'

首先,我使用 pyodbc 连接 Microsoft Access 数据库并从中获取数据。

MDB = "E:/Research/2000-01.mdb"; DRV = '{Microsoft Access Driver (*.mdb)}'; PWD = 'pw'
con = pyodbc.connect('DRIVER={};DBQ={};PWD={}'.format(DRV,MDB,PWD))
cur = con.cursor()
SQL = 'SELECT * FROM 200001;'
rows = cur.execute(SQL).fetchall()
cur.close()
con.close()

然后使用这个类,

class UnicodeWriter:
    """
    A CSV writer which will write rows to CSV file "f",
    which is encoded in the given encoding.
    """

def __init__(self, f, dialect=csv.excel, encoding="utf-8", **kwds):
    # Redirect output to a queue
    self.queue = cStringIO.StringIO()
    self.writer = csv.writer(self.queue, dialect=dialect, **kwds)
    self.stream = f
    self.encoder = codecs.getincrementalencoder(encoding)()

def writerow(self, row):
    self.writer.writerow([s.encode("utf-8") for s in row])
    # Fetch UTF-8 output from the queue ...
    data = self.queue.getvalue()
    data = data.decode("utf-8")
    # ... and reencode it into the target encoding
    data = self.encoder.encode(data)
    # write to the target stream
    self.stream.write(data)
    # empty queue
    self.queue.truncate(0)

def writerows(self, rows):
    for row in rows:
        self.writerow(row)

我开始写utf-8的csv文件

with open("E:/Research/200001.txt", 'wb') as f:
    writer = UnicodeWriter(f)
    writer.writerows(rows)

行中的示例行是

(577540, u'1', datetime.datetime(2000, 1, 1, 0, 0), u'85411000', u'53', u'4403944851', u'44039', u'10', u'116', u'110', u'4', u'01', 89956, 0.15575717389583588, u'\u5916\u5546\u72ec\u8d44\u4f01\u4e1a', u'\u5c71\u7279\u7535\u5b50 (\u6df1\u5733) \u6709\u9650\u516c\u53f8', u'\u6df1\u5733\u5b9d\u5b8972\u533a\u5b9d\u77f3\u8def\u53f7', u'755 27757943', u'', u'518101', u'', u'\u90d1\u66fc\u5a1c', u'\u4e8c\u6781\u7ba1\uff0c\u4f46\u5149\u654f\u4e8c\u6781\u7ba1\u6216\u53d1\u5149\u4e8c\u6781\u7ba1\u9664\u5916', u'\u5e7f\u4e1c\u7701\u6df1\u5733', u'\u65e5\u672c', u'\u6df1\u5733\u6d77\u5173', u'\u4e00\u822c\u8d38\u6613', u'\u6c7d\u8f66\u8fd0\u8f93', u'\u4e2a/\u5957', u'\u9999\u6e2f', u'\u8fdb\u53e3') 

看起来每一行都包含一些整数和日期时间的东西。有解决这个问题的想法吗?非常感谢!

最佳答案

你可能需要先做这样的事情,就在 writer.writerows 之前:

rows = [[unicode(x) for x in row] for row in rows]

或者,我猜测它在尝试写入数据库行 ID 时失败了。所以你也可以尝试把它切掉:

rows = [row[1:] for row in rows]

关于python - 在 python 中导出一个 utf-8 csv 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17159590/

相关文章:

Python-Excel导出

python - 如何在pyQt5 contextMenuEvent中获取正确的表行索引

java - 跳过格式错误的 csv 行

python - 如何在python中从西类牙语编码和解码

python - AutoScaleConnection.get_all_groups() 不适用于 boto

python - Django 数据迁移与 models.py 不匹配

python - 如何使用Python删除csv文件中的双引号

java - 需要帮助在java中将数据写入csv文件

更新到 Java 8 后,Android 以错误的编码显示文本

c# - 追加到 txt 文件会产生奇怪的字符