在 GCP Vertex AI 中尝试对 AutoML 模型进行批量预测时,批量预测结果跨越多个文件(从用户角度来看这并不方便)。如果它是单个批量预测结果文件,即覆盖单个文件中的所有记录,则会使过程更加简单。
例如,我的输入数据集文件中有 5585 条记录。批量预测结果由21个文件组成,每个文件的记录范围为200-300条,总共5585条记录。
最佳答案
对图像、文本、视频、表格 AutoML 模型进行批量预测,使用分布式处理运行作业,这意味着数据分布在任意虚拟机集群中,并以不可预测的顺序进行处理,因此您将获得预测结果存储在 Cloud Storage 中的各种文件中。由于批量预测输出文件的生成顺序与输入文件不同,因此已提出功能请求,您可以从此 link 跟踪此请求的更新。 .
我们目前无法提供预计到达时间,但您可以在问题跟踪器中关注进度,并且可以“标记”该问题以接收自动更新并引用此 link 给予关注。 .
但是,如果您正在对 tabular AutoML model 进行批量预测,您可以选择 BigQuery 作为存储,其中所有预测输出将存储在单个表中,然后您可以将表数据导出到单个 CSV 文件。
关于google-cloud-platform - GCP Vertex AI 中的批量预测,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/69689785/