我正在追溯清理 Offer Drive 产品 ( http://offerletter.io/drive.html ) 的大量数据。我正在尝试标准化自由格式的“位置”字段,以确定提交的位置是否位于美国(或不)。
值的粒度可能有所不同,但都是“真实的”,例如
加利福尼亚州旧金山
密尔沃基
类加罗尔
我的问题是,是否有一种好方法(某些 API 或库)可以根据用户提交的字符串智能地规范这些内容,以便我可以说:
normalized = GeoNormalize.normalize("San Francisco")
return normalized.country() == "United States"
我真的很喜欢 chronyk
( https://github.com/KoffeinFlummi/Chronyk ) 并且类似的位置信息会很棒。
最佳答案
有很多,通常由 map 或 GIS 供应商提供。
例如,Google 地理编码服务接受一个字符串并以标准格式返回一组经过排名的位置:
https://developers.google.com/maps/documentation/geocoding/?csw=1#Geocoding
雅虎也有一个:
https://developer.yahoo.com/boss/geo/#overview
就像我说的,有很多很多。它们通常在轻度使用时免费,但在一定时间后会产生使用费。
关于python - 用于根据提交的字符串推断国家/地区的库或 API?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30656672/