pagination - 通过 Boto3 进行 DynamoDB 分页,NextToken 不存在但 LastEvaluatedKey 存在?

标签 pagination amazon-dynamodb boto3

boto3 和 dynamodb 分页器的文档指定在分页时应返回 NextToken,然后您将在下一个查询中包含该 token 以获取开始 token 以恢复分页 session (通过 RESTful API 访问信息时会发生这种情况)。

但是,我的测试表明它不会在结果中返回 NextToken,而是返回 LastEvaluatedKey。我想我可以使用 LastEvaluatedKey 作为 token ,但这不起作用?

paginator = client.get_paginator('scan')
page_iterator = paginator.paginate(TableName='test1', PaginationConfig={'PageSize': 1 , 'MaxItems': 5000,  'MaxSize': 1 })

    for page in page_iterator:
        print(page)
        break   

我希望从 page_iterator 返回的页面对象包含 NextToken Key 但它没有?
{'Items': [{'PK': {'S': '99'}, 'SK': {'S': '99'}, 'data': {'S': 'Test Item 99'}}], 'Count': 1, 'ScannedCount': 1, 'LastEvaluatedKey': {'PK': {'S': '99'}, 'SK': {'S': '99'}}, 'ResponseMetadata': {'RequestId': 'DUE559L8KVKVH8H7G0G2JH0LUNVV4KQNSO5AEMVJF66Q9ASUAAJG', 'HTTPStatusCode': 200, 'HTTPHeaders': {'server': 'Server', 'date': 'Mon, 27 May 2019 14:22:09 GMT', 'content-type': 'application/x-amz-json-1.0', 'content-length': '153', 'connection': 'keep-alive', 'x-amzn-requestid': 'DUE559L8KVKVH8H7G0G2JH0LUNVV4KQNSO5AEMVJF66Q9ASUAAJG', 'x-amz-crc32': '3759060959'}, 'RetryAttempts': 0}}

我错过了什么?

更新:不知何故与此有关? How to use Boto3 pagination

最佳答案

有几种方法可以使用 boto3 扫描分页器解决此问题。

第一个选项是拨打 build_full_result像这样:

result = paginator.paginate(TableName="your_table", PaginationConfig={"MaxItems":10, "PageSize": 10}).build_full_result()

这将返回一个包含 10 个项目的响应,如果超过 10 个项目,则会填充“NextToken”。这可能是最简单的方法,您可以将 MaxItems 视为返回的页面大小,如果 'NextToken' 为空,则您在扫描结束时。

我注意到如果您不指定页面大小,结果是相同的,但消耗的容量和“ScannedCount”会更高。

另一种方法是使用 botocore.paginate 中的 TokenEncoder 对“StartingToken”进行编码。直接地。

如果对分页器的初始调用是这样的:
pagination_config = {
    "MaxItems": 5000,
    "PageSize": 10,
}

scan_iterator = scan_paginator.paginate(
    TableName="your_table_name",
    PaginationConfig=pagination_config
)

分页结果将如问题所述。前 10 个结果将在第一页中返回,并且未指定 'NextToken' 但指定了 'LastEvaluatedKey'。

要使用它,请将返回的“LastEvaluatedKey”编码为“ExclusiveStartKey”并将其作为“StartingToken”传递到分页配置中。
from botocore.paginate import TokenEncoder
encoder = TokenEncoder()
for page in scan_iterator:
    if "LastEvaluatedKey" in page:
            encoded_token = encoder.encode({"ExclusiveStartKey": page["LastEvaluatedKey"]})

然后:
pagination_config = {
    "MaxItems": 500,
    "PageSize": 10,
    "StartingToken": encoded_token
}

将主键编码为“ExclusiveStartKey”的原因是它是 actual scan API期待。本质上,分页器将“LastEvaluatedKey”和“ExclusiveStartKey”编码/解码为“NextToken”和“StartingToken”值。如果您对执行 build_full_result 时返回的“NextToken”进行 base64 解码您会看到它也使用了“ExclusiveStartKey”。

关于pagination - 通过 Boto3 进行 DynamoDB 分页,NextToken 不存在但 LastEvaluatedKey 存在?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56328270/

相关文章:

node.js - 返回 undefined object 属性(nodejs)

json - 有没有办法使用 boto3 将 CSV 对象从 S3 存储桶流式传输到 AWS lambda?

.net - 带过滤器的 DynamoDB 扫描,匹配 'is-in-set' 条件

java - 使用 DynamoMapper 和类 Annotation 创建具有全局二级索引的表

python-3.x - 如何根据文件修改日期从 s3 存储桶下载文件?

python - 如何使用 Amazon SNS 和 Python 和 boto3 发送带有自定义发件人 ID 的 SMS

java - Mongo - Java - 获取所有文档将字符串日期排序为日期

ruby-on-rails-3 - 选项卡内分页

mysql - 有多个选择时如何使用 SQL_CALC_FOUND_ROWS

java - dynamodb 中项目的生存时间