hadoop - 大数据集用于大数据分析

标签 hadoop google-analytics dataset bigdata

伙计们,我正在寻找一些数据集,这些数据集包含至少5gb的海量数据,这些数据是公开可用的,例如交通,保险,天气,论坛,医院等。可以执行一些大数据分析。我用谷歌搜索,但找不到大量数据,尽管我发现MB的数据集,但寻找GB的数据集。

如果有人对至少4 GB的数据集的大小有任何想法,请与我分享链接。
提前致谢。

最佳答案

首先,大数据不仅仅是数量。还有更多标准,例如变化,速度等。

但最近,《福布斯》发表了一篇有关2016年35个免费大数据集的文章。您可以查看here

关于hadoop - 大数据集用于大数据分析,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35377096/

相关文章:

hadoop - 如果 2 个映射器输出相同的键,reducer 的输入是什么?

javascript - Google 的 Universal Analytics 代码如何允许我在脚本仍在加载时进行方法调用?

php - PHP/MySQL 中的多个数据表?

audio - 是否有标记的语音速率数据集?使用像快,中,慢或基于每分钟字数的标签?

python-3.x - 将 numpy 数据集转换为 netCDF

hadoop - 当我尝试将hadoop jar运行到远程节点时出现错误

hadoop - 使用 hive -e 'select' 打印列标题时是否可以停止 HIVE 打印数据库?

hadoop - CDH 4.2.0和Ganglia兼容性

android - Firebase Analytics - firebase-core :9. 0.0 - FirebaseInstanceId:后台同步失败:INVALID_SENDER

google-analytics - 同一页面上有多个Google Analytics(分析)标签