对于一个项目,我使用 Apache Poi 在 Java 应用程序中将 Excel 文档转换为 JSON。将来,此任务将使用 AWS Lambda 完成,因为目前它可能需要很长时间(最多 20 秒)并且内存消耗很高。
要求:
- 支持XLS和XLSX格式
- 评估公式(所以流式传输是不可能的?)
- 最多 100.000 行但小于 1MB
有了 AWS Lamda,我现在可以使用 Java、Python 或 NodeJs。 我的问题是:我的 Apache POI 方法是可行的还是有更合适的框架?例如。 sheetjs似乎是个不错的候选人。我无法找到此类框架的最新性能比较。
最佳答案
试试 python 中的 pyexcel_xlsx 库。我用它来将 xlsx 转换为 json。甜蜜而简单的一个。与其他 Python 库相比速度也更快。
示例代码:
from pyexcel_xlsx import get_data;
import time;
import json;
data = get_data("RefinedProduct.xlsx")
sheetName = "Table 6b";
for i in range(0, len(data[sheetName])):
for j in range(0, len(data[sheetName][i])):
print("Row: " + str(i) + ", Column: " + str(j) + ", Value: "+ str(data[sheetName][i][j]));
关于java - 在 AWS Lambda 上解析 Excel 文档,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40629910/