我尝试从 Yelp 数据集挑战网站 (https://www.yelp.com/dataset_challenge) 打开文件。我已经成功做到了,但是,我无法打开文件,因为它没有扩展名。它大约是 4 GB。我认为它可能是一个 JSON 文件,因为当我四处搜索时,过去它是。但是,我不知道如何打开它或将其转换为 CSV。我想对这些数据使用 Python 进行一些分析。谁能帮我?谢谢。
最佳答案
我遇到了同样的问题。事实证明,tar 文件(没有扩展名的文件)也是一个 tar 文件 - 所以下载基本上是一个 tar 文件中的 tar 文件。提取原始文件后,将 tar 扩展名添加到它,然后提取它。提取后,您将拥有数据集的所有不同 json 文件。
关于python - Yelp 数据文件类型,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43624065/