json - 如何将 JSON 输出提取到数据框?

标签 json r geospatial nested-lists

我有一个包含 3000 多条记录的数据框,其中包括每次观测的纬度和经度坐标。我想从每组坐标中获取国家和州或省。

我似乎有部分解决方案,但我是 R 的新手,不了解如何将信息从 JSON 输出提取到可以绑定(bind)到原始数​​据集的数据框中。

如何将 fromJSON 创建的嵌套列表解析为 data.frame? 具体,我希望新数据框看起来像这样:

纬度、经度、国家、州(列名)

或者,对于我获取空间信息的问题的更好解决方案表示赞赏!

这是我的代码:

library(RDSTK)
library(httr)
library(rjson)
Coords <- structure(list(Latitude = c(43.30528, 46.08333, 32.58333, 46.25833, 45.75, 46.25, 45.58333, 45.58333, 44.08333, 45.75), 
                         Lontitude = c(-79.80306, -82.41667, -117.08333, -123.975, -85.75, -123.91667, -86.75, -86.75, -76.58333, -85.25
                                         )), .Names = c("Latitude", "Longitude"), row.names = c(1L, 2L, 3L, 4L, 5L, 6L, 7L, 8L,9L, 10L), class = "data.frame")

json_file <- fromJSON(coordinates2politics(Coords$Latitude, Coords$Longitude))

最佳答案

我更喜欢使用 jsonlite 在 R 中解析 JSON。

要解析嵌套的 JSON 列表,您可以在 lapply 中执行 fromJSON 调用。

jsonlite::fromJSON 试图为您简化结果。但是,由于 JSON 旨在处理嵌套数据结构,因此您通常会返回一个列表的 data.frame,因此要获得您想要的 data.frame,您需要知道其中的哪个元素你想要的列表,然后提取它。

例如

library(RDSTK)
library(jsonlite)

js <- coordinates2politics(Coords$Latitude, Coords$Longitude)
lst <- lapply(js, jsonlite::fromJSON)

lst[[1]]$politics
#           type friendly_type                       name  code
# 1       admin2       country                     Canada   can
# 2       admin4         state                    Ontario  ca08
# 3 constituency  constituency            Hamilton Centre 35031
# 4 constituency  constituency                 Burlington 35010
# 5 constituency  constituency Hamilton East-Stoney Creek 35032

要获取data.frame,您可以构造另一个lapply来提取您想要的元素,然后将其与do.call一起放入(..., rbind),或者我的偏好是 data.table::rbindlist(...)

lst_result <- lapply(lst, function(x){
    df <- x$politics[[1]]
    df$lat <- x$location$latitude
    df$lon <- x$location$longitude
    return(df)
})

data.table::rbindlist(lst_result)

#            type friendly_type                                  name                   code      lat        lon
# 1:       admin2       country                                Canada                    can 43.30528  -79.80306
# 2:       admin4         state                               Ontario                   ca08 43.30528  -79.80306
# 3: constituency  constituency                       Hamilton Centre                  35031 43.30528  -79.80306
# 4: constituency  constituency                            Burlington                  35010 43.30528  -79.80306
# 5: constituency  constituency            Hamilton East-Stoney Creek                  35032 43.30528  -79.80306
# 6:       admin2       country                                Canada                    can 46.08333  -82.41667
# 7:       admin4         state                               Ontario                   ca08 46.08333  -82.41667

或者,要获得有关每个纬度/经度的更多详细信息,您可以通过 library(googleway)(免责声明:我编写了 googleway)使用 Google 的 API 来对纬度/经度进行反向地理编码。

为此,您需要一个有效的 Google API key (除非您付费,否则每天只能请求 2,500 个)

library(googleway)

key <- "your_api_key"

lst <- apply(Coords, 1, function(x){
    google_reverse_geocode(location = c(x["Latitude"], x["Longitude"]),
                           key = key)
})

lst[[1]]$results$address_components
# [[1]]
#                              long_name                           short_name                                  types
# 1 Burlington Bay James N. Allan Skyway Burlington Bay James N. Allan Skyway                                  route
# 2                           Burlington                           Burlington                    locality, political
# 3         Halton Regional Municipality         Halton Regional Municipality administrative_area_level_2, political
# 4                              Ontario                                   ON administrative_area_level_1, political
# 5                               Canada                                   CA                     country, political
# 6                                  L7S                                  L7S        postal_code, postal_code_prefix

或类似地通过 library(ggmap),也受 Google 的 2,500 限制。

library(ggmap)

apply(Coords, 1, function(x){
    revgeocode(c(x["Longitude"], x["Latitude"]))
})

# 1 
# "Burlington Bay James N. Allan Skyway, Burlington, ON L7S, Canada" 
# 2 
# "308 Brennan Harbour Rd, Spanish, ON P0P 2A0, Canada" 
# 3 
# "724 Harris Ave, San Diego, CA 92154, USA" 
# 4 
# "30 Cherry St, Chinook, WA 98614, USA" 
# 5 
# "St James Township, MI, USA" 
# 6 
# "US-101, Chinook, WA 98614, USA" 
# 7 
# "2413 II Rd, Garden, MI 49835, USA" 
# 8 
# "2413 II Rd, Garden, MI 49835, USA" 
# 9 
# "8925 S Shore Rd, Stella, ON K0H 2S0, Canada" 
# 10 
# "Charlevoix County, MI, USA"

关于json - 如何将 JSON 输出提取到数据框?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38234692/

相关文章:

java - 无法在 java 中使用 Google Gson 解析此内容

ios - 调用注释填充TableView : correcting code errors

r - 如何填充由直线和曲线创建的几何图形?

r - 如何根据R中列值的范围拆分数据帧?

javascript - 从 Bing Phonebook API 获取业务类型/行业

java - 解析 Json 数组导致 This is not a JSON Array 异常

json - 使用Elasticsearch索引/标记嵌套JSON

r - 安装 ggbiplot 时出错 - 未找到对象 'digest_impl'

MongoDB 地理空间查询计数问题(始终为 100)

ios - 获取某个位置的最新消息