amazon-web-services - 使用 Amazon Sagemaker Ground Truth 自动标记文本数据

标签 amazon-web-services amazon-sagemaker labeling

地面事实进行自动标记所需的最小文本行数是多少?我有包含 1000 行的文本文件,这足以开始使用 sagemaker ground Truth 进行自动标记吗?

最佳答案

我是 Amazon SageMaker Ground Truth 团队的产品经理,我很乐意帮助您解决这个问题。最低系统要求是 1,000 个对象。在文本分类实践中,只有当您拥有 2,000 到 3,000 个文本对象时,我们通常才会看到有意义的结果(自动标记的数据百分比)。请记住,性能是可变的,取决于您的数据集和任务的复杂性。

关于amazon-web-services - 使用 Amazon Sagemaker Ground Truth 自动标记文本数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55376406/

相关文章:

c++ - 如何使用 C++ 读取存储在 opencv 中 findcontour 函数输出中的数据

machine-learning - Caffe 中的目录结构和标签

java - 在模拟器/手机中运行应用程序时出现 NoClassDefFoundError [更新到上一个问题]

amazon-web-services - Cloudformation AWS CLI 查询具有多个嵌套堆栈的所有堆栈资源

ruby-on-rails - Rails 开发环境尝试连接到 AWS 数据库,而不是本地主机的 PostgreSQL

javascript - 如何管理使用 AWS Amplify Authentication 创建的用户

amazon-sagemaker - 如何指定 sagemaker 中的 worker 数量?

python - 分布式处理 - AWS Sagemaker

jupyter-notebook - 在 IPython 中混合 shell 变量和 python 变量 '!command'

r - 使用查找表和 sjlabelled::set_label 标记变量