我正在尝试下载YouTube-8M数据集的一小部分。它只是具有视频功能和标签的数据集,您可以创建自己的模型进行分类。
他们声称将下载数据集的命令是这样的:
curl storage.googleapis.com/data.yt8m.org/download_fix.py | shard=1,100 partition=2/frame/train mirror=us python
这实际上根本不起作用,并且产生的错误是:
'shard' is not recognized as an internal or external command,operable program or bash file.
我发现有人张贴在论坛上。它说在变量中添加“设置”,这似乎可以部分解决我的问题。
curl storage.googleapis.com/data.yt8m.org/download_fix.py | set shard=1,100 partition=2/video/train mirror=us python
下载似乎已开始,并弹出错误。现在的错误是
(23) Failed writing body
。那么用于下载数据集的命令行是什么。
最佳答案
我会尝试改用Kaggle API。您可以使用以下方法安装API:
pip install Kaggle
然后下载您的凭据(step-by-step guide here)。最后,您可以像这样下载数据集:
kaggle competitions download -c youtube8m
如果只需要一部分数据集,则可以首先列出所有可下载文件:
kaggle competitions files -c youtube8m
然后仅下载所需的文件:
kaggle competitions download -c youtube8m -f name_of_your_file.extension
希望有帮助! :)
关于youtube - 在Windows 8.1中下载带有curl的YouTube-8M数据集时出错,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50545299/