java - 在 AWS Lambda 上解析 Excel 文档

标签 java node.js excel apache-poi aws-lambda

对于一个项目,我使用 Apache Poi 在 Java 应用程序中将 Excel 文档转换为 JSON。将来,此任务将使用 AWS Lambda 完成,因为目前它可能需要很长时间(最多 20 秒)并且内存消耗很高。

要求:

  • 支持XLS和XLSX格式
  • 评估公式(所以流式传输是不可能的?)
  • 最多 100.000 行但小于 1MB

有了 AWS Lamda,我现在可以使用 Java、Python 或 NodeJs。 我的问题是:我的 Apache POI 方法是可行的还是有更合适的框架?例如。 sheetjs似乎是个不错的候选人。我无法找到此类框架的最新性能比较。

最佳答案

试试 python 中的 pyexcel_xlsx 库。我用它来将 xlsx 转换为 json。甜蜜而简单的一个。与其他 Python 库相比速度也更快。

示例代码:

from pyexcel_xlsx import get_data;
import time;
import json;

data = get_data("RefinedProduct.xlsx")
sheetName = "Table 6b";

for i in range(0, len(data[sheetName])):
    for j in range(0, len(data[sheetName][i])):
        print("Row: " + str(i) + ", Column: " + str(j) + ", Value: "+ str(data[sheetName][i][j]));

关于java - 在 AWS Lambda 上解析 Excel 文档,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40629910/

相关文章:

java - 如何创建一个 void 函数来列出 13 号下一个 13 星期五

java - 为什么Kafka消费者性能慢?

选择范围时出现 VBA 运行时错误 1004 "Application-defined or Object-defined error"

php - 以多级方法对数据进行排序,例如使用 PHP 和 MySql 在 Excel 中

c - 将二维数组 (array[j][i]) 中的值输出到 Excel 中以形成包含 i 列和 j 行的表格

java - 在java中强制在程序启动时加载类

java - Java 中枚举的命名 : Singular or Plural?

javascript - Node js 错误 : Protocol "https:" not supported. 预期为 "http:"

javascript - websocket 客户端在发送大数据时断开连接

javascript - 正则表达式查找并替换文件 Javascript 中的文件路径