我正在生成一个大型 PDF,其中包含多轮问题。
我是通过浏览器执行此操作的,更新需要相当长的时间,最后它说它仍在后台运行。
为了检查它何时完成,我进行了 api 调用以获取操作的详细信息。最终这会返回状态失败,并且没有任何错误代码。
当我检查我的 QnA 对时,我正好有 1000 个,这似乎不是一个随机数。
但是我在任何地方都找不到任何有关 QnA 对限制的信息,我发现它应该是无限的。
我做错了什么还是这里发生了什么?
<小时/>编辑
当我查询服务器统计信息时,这就是我得到的答案。 documentCount 的配额为 null,这意味着它是无限的。
` {
"@odata.context": "mylink",
"counters": {
"documentCount": {
"usage": 2000,
"quota": null
},
"indexesCount": {
"usage": 2,
"quota": 3
},
"indexersCount": {
"usage": 0,
"quota": 3
},
"dataSourcesCount": {
"usage": 0,
"quota": 3
},
"storageSize": {
"usage": 1714194,
"quota": 52428800
},
"synonymMaps": {
"usage": 1,
"quota": 3
}
},
"limits": {
"maxFieldsPerIndex": 1000,
"maxIndexerRunTime": "PT1M",
"maxFileExtractionSize": 16777216,
"maxFileContentCharactersToExtract": 32768,
"maxFieldNestingDepthPerIndex": 10,
"maxComplexCollectionFieldsPerIndex": 40,
"maxComplexObjectsInCollectionsPerDocument": 3000
}
} `
<小时/>
编辑2
我有一些重复的问题,我删除了这些问题并将一些问题重构为子问题。不知道为什么,现在上传成功了。
最佳答案
根据 QnA Maker Limits页面,以下限制适用于知识库的内容:
Length of answer text: 25,000 Length of question text: 1,000 Length of metadata key/value text: 100 Supported characters for metadata name: Alphabets, digits and _ Supported characters for metadata value: All except : and | Length of file name: 200 Supported file formats: ".tsv", ".pdf", ".txt", ".docx", ".xlsx". Maximum number of alternate questions: 300 Maximum number of question-answer pairs: Depends on the Azure Cognitive Search tier chosen. A question and answer pair maps to a document on Azure Cognitive Search index. URL/HTML page: 1 million characters
重要的部分是“问题和答案对映射到 Azure 认知搜索索引上的文档。”
文档可用 here .
因此,如果您使用免费套餐,则可能会达到每个索引器 1-3 分钟的最大运行时间限制,或者根据表下的上标 1 获得免费服务 1 分钟的最大运行时间限制。
您可以尝试调用 this API欲了解更多信息,并确保您处于 document size limit .
编辑
查看 QnA Maker 可能会有所帮助 data source guidelines ,以及结构化 PDF 内容的具体指南 here 。还有一个formatting guideline .
QnA Maker identifies sections and subsections and relationships in the file based on visual clues like:
font size font style numbering colors
如果将来有人在 PDF 格式方面遇到困难,那么我建议尝试 .docx
、xlx
或 .tsv
格式因为它们可以让您更具体地了解什么是问题以及什么是答案
对于文档:
alternating Questions and Answers per line, one question per line followed by its answer in the following line
对于电子表格:
Question1 \t Answer1 \t Key1:Value1 | Key2:Value2
根据 this link
关于azure - QNAmaker QNA 对的最大数量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60530020/