http://www.cnblogs.com/LBSer/p/4471742.html
地理围栏(Geo-fencing)是LBS的一种应用,就是用一个虚拟的栅栏围出一个虚拟地理边界,当手机进入、离开某个特定地理区域,或在该区域内活动时,手机可以接收自动通知和警告。如下图所示,假设地图上有三个商场,当用户进入某个商场的时候,手机自动收到相应商场发送的优惠券push消息。地理围栏应用非常广泛,当今移动互联网主要app如美团、大众点评、手淘等都可看到其应用身影。
图1 地理围栏示意图
地理围栏的核心问题就是判断用户是否落在某多边形围栏内部。本文将介绍实际应用中常用的解决方法。
地理围栏一般是多边形,如何判断点在多边形内部呢?可以通过射线法来判断点是否在多边形内部。如下图所示,从该点出发沿着X轴画一条射线,依次判断该射线与每条边的交点,并统计交点个数,如果交点数为奇数,则在多边形内部(如图3个交点),如果焦点数是偶数,则在外部,射线法对凸和非凸多边形都适用,复杂度为O(N),其它N是边数。源码可参考(http://alienryderflex.com/polygon/)
图2 射线法判断点在多边形内外
当地理围栏多边形数目较少时,我们可以依次遍历每一个多边形(暴力遍历法),然后用射线法进行判断,这样效率也很高。而当多边形数目较多时,比如有10万个多边形,这个时候需要执行10万次射线法,响应时间达到3.9秒,这在互联网应用几乎不可忍受。下表是本人的简单测试,多边形边数均为7。
表1 射线法性能测试
暴力遍历法效率低下的原因是与每一个多边形都进行了射线法判断,因此我们的优化思路很直接,首先进行粗筛,找到符合条件的少量多边形,然后对粗筛后的多边形使用射线法判断,这样射线法的执行次数大大降低,效率也能大大提高。怎么粗筛呢?对于一维数据我们常常使用索引的方法,比如通过B树索引找到范围区间段,然后在此范围区间段内进行遍历查找,对于二维空间数据常常使用空间索引的方法,比如通过R树找到范围区间内的多边形,然后对此范围内的多边形进行精确判断,下面将介绍R树的解决思路。
由于多边形形状各异,我们需要以一种统一的方式来对多边形进行近似,最简单的方式就是用最小外包矩形来表示多边形。
图3 最小外包矩形(MBR)表达多边形
图4 对最小外包矩形进行R树索引
a)首先通过R树迅速判断用户所在位置(粗红点)是否被外包矩形覆盖(图5,红色点代表用户所在位置);
b)如果不被任何外包矩形覆盖则返回不在地理围栏多边形内;
c)如果被外包矩形覆盖则还需要进一步判断是否在此外包矩形的多边形内部,采用上文提到的射线法判断(图2)。
图5 R树查询示例
某线上应用服务有30万个地理围栏多边形,通过在内存中构建R树索引,使得线上实时地理围栏查询平均响应时间在1ms以内,而暴力查询响应时间是9秒左右。
实际地理围栏应用各式各样,本文介绍的是多边形数目较多时的场景。有些应用的地理围栏多边形可能就几个,但是每个多边形都非常复杂,比如单个多边形边数就超过十几万条,这时候射线法执行一次就很耗时(射线法时间复杂度为O(N),N为多边形边数),即使对多边形进行R树索引最终还是得执行射线法。如何解决呢?笔者在实际应用中对边数较多(如超过1万)的多边形的边再单独进行R树索引,这样射线法求交点的时候首先通过R树快速粗筛得到符合条件的边,然后对粗筛后的边进行精确求交,这样大大提高了效率。
https://pypi.python.org/pypi/Rtree/ (Python)
http://jsi.sourceforge.net/ (Java)
https://github.com/leaflet-extras/RTree (Javascript)
http://sourceforge.net/p/cspatialindexrt/code/HEAD/tree/ (C#)
class="p1">深入浅出空间索引:为什么需要空间索引
深入浅出空间索引:2
GeoHash核心原理解析