machine-learning - 地理空间机器学习的人口抽样

标签 machine-learning statistics geospatial

我正在尝试根据与混合城市郊区环境中其他特征的距离来构建地理空间特征的预测模型,例如,根据到最近的道路、住宅区的距离,办公大楼位于某个位置的可能性,和购物区。我有一组特征位置,但 block 并没有均匀地分散在整个区域中,某些区域非常稀疏,而另一些区域则非常密集。使用决策树来预测某个位置是否存在学校,我需要一个包含正面和负面案例的训练集。我应该如何创建此类案例的样本?

最佳答案

您需要以下格式的数据:

nearestRoadhousingEstateshoppingDistrict、...、schoolPresent

nearestRoad 将是 realNumberhousingEstateshoppingDistrict 将是二进制变量(我猜) 。你检查过谷歌地图吗?他们是否为您提供了可让您查询特定(纬度、经度)坐标的 API?如果他们这样做了,那么您可以按如下方式生成数据集:

假设一所学校位于坐标(x,y)处。然后进行半径为 5 英里的网格搜索,以获得每个要素的精确值。例如,您可能在坐标 (x+1, y+2) 处找到一个购物区,因此对于该特定实例,该特征等于 1。

这可能很乏味,但如果存在这样的 API,那么它似乎绝对是可能的。

关于machine-learning - 地理空间机器学习的人口抽样,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40982679/

相关文章:

python - 来自 sklearn 的 OneHotEncoder 在传递类别时给出 ValueError

matlab - 在 MATLAB 中通过二进制训练数据训练决策树

c++ - C++ 中的免费地理数据类库(纬度/经度/距离/转换)

r - 这些数据集之间使用 R 进行深度学习的 MAE 结果存在差异的原因是什么?

machine-learning - 如何在Keras中使一层输出两层,并且一层连接到两层?

algorithm - 独立访客数模块

python - numpy.random.choice 替换是否等同于单次试验的多项式抽样?

statistics - N ((1,0)T , I) 与高斯分布相关的含义

MySQL getpolygon函数错误

r - 确定形状文件的区域