我正在尝试根据与混合城市郊区环境中其他特征的距离来构建地理空间特征的预测模型,例如,根据到最近的道路、住宅区的距离,办公大楼位于某个位置的可能性,和购物区。我有一组特征位置,但 block 并没有均匀地分散在整个区域中,某些区域非常稀疏,而另一些区域则非常密集。使用决策树来预测某个位置是否存在学校,我需要一个包含正面和负面案例的训练集。我应该如何创建此类案例的样本?
最佳答案
您需要以下格式的数据:
nearestRoad
、housingEstate
、shoppingDistrict
、...、schoolPresent
nearestRoad
将是 realNumber
,housingEstate
和 shoppingDistrict
将是二进制变量(我猜) 。你检查过谷歌地图吗?他们是否为您提供了可让您查询特定(纬度、经度)坐标的 API?如果他们这样做了,那么您可以按如下方式生成数据集:
假设一所学校位于坐标(x,y)
处。然后进行半径为 5 英里的网格搜索,以获得每个要素的精确值。例如,您可能在坐标 (x+1, y+2)
处找到一个购物区,因此对于该特定实例,该特征等于 1。
这可能很乏味,但如果存在这样的 API,那么它似乎绝对是可能的。
关于machine-learning - 地理空间机器学习的人口抽样,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40982679/