python - 将表格分隔符更改为另一个字符

标签 python csv spreadsheet tabula

我需要从 pdf 中捕获一些数据并输入到 Excel 文件中,但要创建宏来组织单元格,我需要“,”以外的字符。因为某些值(value)数据需要“,”来表示分。有任何想法吗 ? (像“/”或“-”这样的字符就可以解决问题)

当我将 pdf 转换为 csv 时,所有数据都位于一个单元格中,这就是我需要使用宏的原因。 How my data is organized into excel

from tabula import read_pdf
from tabula import convert_into
convert_into("B.pdf", "BBBBB.csv", output_format="csv", pages=1,coding = 'latin-1',stream=True, guess = False ,
         area = (306.9,253,379,570),
         columns = (347,399.1,443.4,481.6,514.3,543.5,572))

最佳答案

如果您想继续使用convert_into,您可以设置output_format="tsv",它将转换为制表符分隔格式的表格。 https://tabula-py.readthedocs.io/en/latest/tabula.html#tabula.wrapper.convert_into 除此之外,您可以使用 read_csv 转换为 DataFrame,然后使用 df.to_csv 设置分隔符。

关于python - 将表格分隔符更改为另一个字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58383642/

相关文章:

python - utf-16-le BOM csv 文件

python - Pyspark 读取带有模式、 header 检查和存储损坏记录的 csv

templates - 用于 CSV 导入的 Libreoffice Calc 模板

java - 如何使用 Apache POI 旋转电子表格单元格中的文本?

python - 如果我知道迭代的 ID,是否可以跳过 itertools.product() 的循环迭代?

python - 导入图像适用于 GAE,但不适用于 dev_appserver.py

python - python模块存储在哪里?

PHP Sql语句从MySQL导出表数据

python - Pandas 在有条件时不返回同一行中的值

phpmyadmin - 导出 MySQL 数据库