python - Yelp 数据文件类型

标签 python machine-learning yelp

我尝试从 Yelp 数据集挑战网站 (https://www.yelp.com/dataset_challenge) 打开文件。我已经成功做到了,但是,我无法打开文件,因为它没有扩展名。它大约是 4 GB。我认为它可能是一个 JSON 文件,因为当我四处搜索时,过去它是。但是,我不知道如何打开它或将其转换为 CSV。我想对这些数据使用 Python 进行一些分析。谁能帮我?谢谢。

最佳答案

我遇到了同样的问题。事实证明,tar 文件(没有扩展名的文件)也是一个 tar 文件 - 所以下载基本上是一个 tar 文件中的 tar 文件。提取原始文件后,将 tar 扩展名添加到它,然后提取它。提取后,您将拥有数据集的所有不同 json 文件。

关于python - Yelp 数据文件类型,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43624065/

相关文章:

machine-learning - 如何验证两个文本数据集是否来自不同的分布?

machine-learning - 输入为 0 的神经网络

java - Yelp API Android 集成

api - 如何从 Yelp API 请求更大的图像?

python - 对于列表的列表,将字典与 collections.defaultdict 合并

Python。将日期列提取到 pandas 中的 'day of week' 、月份...的几列中

python - 我收到错误消息,因为o​​jit_prehh对象没有属性 'QuerySet',这是什么意思,以及如何解决?

python - 如何将二元类 Logistic 回归与 Python 合并

python - 使用 Python 请求验证 Yelp Fusion API

python - 具有嵌套循环和 if 条件的列表理解,以及新列表的成员资格