我有一个包含 3000 多条记录的数据框,其中包括每次观测的纬度和经度坐标。我想从每组坐标中获取国家和州或省。
我似乎有部分解决方案,但我是 R 的新手,不了解如何将信息从 JSON 输出提取到可以绑定(bind)到原始数据集的数据框中。
如何将 fromJSON 创建的嵌套列表解析为 data.frame? 具体,我希望新数据框看起来像这样:
纬度、经度、国家、州(列名)
或者,对于我获取空间信息的问题的更好解决方案表示赞赏!
这是我的代码:
library(RDSTK)
library(httr)
library(rjson)
Coords <- structure(list(Latitude = c(43.30528, 46.08333, 32.58333, 46.25833, 45.75, 46.25, 45.58333, 45.58333, 44.08333, 45.75),
Lontitude = c(-79.80306, -82.41667, -117.08333, -123.975, -85.75, -123.91667, -86.75, -86.75, -76.58333, -85.25
)), .Names = c("Latitude", "Longitude"), row.names = c(1L, 2L, 3L, 4L, 5L, 6L, 7L, 8L,9L, 10L), class = "data.frame")
json_file <- fromJSON(coordinates2politics(Coords$Latitude, Coords$Longitude))
最佳答案
我更喜欢使用 jsonlite
在 R 中解析 JSON。
要解析嵌套的 JSON 列表,您可以在 lapply
中执行 fromJSON
调用。
jsonlite::fromJSON
试图为您简化结果。但是,由于 JSON 旨在处理嵌套数据结构,因此您通常会返回一个列表的 data.frame,因此要获得您想要的 data.frame
,您需要知道其中的哪个元素你想要的列表,然后提取它。
例如
library(RDSTK)
library(jsonlite)
js <- coordinates2politics(Coords$Latitude, Coords$Longitude)
lst <- lapply(js, jsonlite::fromJSON)
lst[[1]]$politics
# type friendly_type name code
# 1 admin2 country Canada can
# 2 admin4 state Ontario ca08
# 3 constituency constituency Hamilton Centre 35031
# 4 constituency constituency Burlington 35010
# 5 constituency constituency Hamilton East-Stoney Creek 35032
要获取data.frame
,您可以构造另一个lapply
来提取您想要的元素,然后将其与do.call一起放入(..., rbind)
,或者我的偏好是 data.table::rbindlist(...)
lst_result <- lapply(lst, function(x){
df <- x$politics[[1]]
df$lat <- x$location$latitude
df$lon <- x$location$longitude
return(df)
})
data.table::rbindlist(lst_result)
# type friendly_type name code lat lon
# 1: admin2 country Canada can 43.30528 -79.80306
# 2: admin4 state Ontario ca08 43.30528 -79.80306
# 3: constituency constituency Hamilton Centre 35031 43.30528 -79.80306
# 4: constituency constituency Burlington 35010 43.30528 -79.80306
# 5: constituency constituency Hamilton East-Stoney Creek 35032 43.30528 -79.80306
# 6: admin2 country Canada can 46.08333 -82.41667
# 7: admin4 state Ontario ca08 46.08333 -82.41667
或者,要获得有关每个纬度/经度的更多详细信息,您可以通过 library(googleway)
(免责声明:我编写了 googleway)使用 Google 的 API 来对纬度/经度进行反向地理编码。
为此,您需要一个有效的 Google API key (除非您付费,否则每天只能请求 2,500 个)
library(googleway)
key <- "your_api_key"
lst <- apply(Coords, 1, function(x){
google_reverse_geocode(location = c(x["Latitude"], x["Longitude"]),
key = key)
})
lst[[1]]$results$address_components
# [[1]]
# long_name short_name types
# 1 Burlington Bay James N. Allan Skyway Burlington Bay James N. Allan Skyway route
# 2 Burlington Burlington locality, political
# 3 Halton Regional Municipality Halton Regional Municipality administrative_area_level_2, political
# 4 Ontario ON administrative_area_level_1, political
# 5 Canada CA country, political
# 6 L7S L7S postal_code, postal_code_prefix
或类似地通过 library(ggmap)
,也受 Google 的 2,500 限制。
library(ggmap)
apply(Coords, 1, function(x){
revgeocode(c(x["Longitude"], x["Latitude"]))
})
# 1
# "Burlington Bay James N. Allan Skyway, Burlington, ON L7S, Canada"
# 2
# "308 Brennan Harbour Rd, Spanish, ON P0P 2A0, Canada"
# 3
# "724 Harris Ave, San Diego, CA 92154, USA"
# 4
# "30 Cherry St, Chinook, WA 98614, USA"
# 5
# "St James Township, MI, USA"
# 6
# "US-101, Chinook, WA 98614, USA"
# 7
# "2413 II Rd, Garden, MI 49835, USA"
# 8
# "2413 II Rd, Garden, MI 49835, USA"
# 9
# "8925 S Shore Rd, Stella, ON K0H 2S0, Canada"
# 10
# "Charlevoix County, MI, USA"
关于json - 如何将 JSON 输出提取到数据框?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38234692/