mysql - 检测邮寄地址相似度

标签 mysql ruby-on-rails ruby sphinx thinking-sphinx

我们遇到了成员(member)试图注册多个帐户以利用推荐奖励和免费试用奖励的问题。我们需要一个邮寄地址并根据 USPS 对其进行验证,但发现这仍然无法提供足够的保护,并且用户仍然很容易更改该地址上的元素(例如“第 2 行”)并使其仍然有效。

检测其他用户是否已使用某个地址注册的最佳方法是什么?

地址变体示例:

格兰特大街59号 2楼

格兰特大街59号 套房2

与精确比较类似的问题是,街道地址可能有多个租户在不同的公寓/办公室等。

我们正在使用 Rails 3、MySQL、Memcache、Sphinx

最佳答案

我们面临着类似的问题,尽管是在不同的背景下。您无能为力,我们基本上编写了一种方法,尝试根据标准化电话号码、标准化街道地址、Leveshtein distance 来识别可能的重复项。名称和地址、对地址进行地理编码时的物理距离等。找出某个东西是否真的重复仍然需要人工,但至少可以显着减少可能的候选者的数量。

关于mysql - 检测邮寄地址相似度,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6807768/

相关文章:

java - SQL 注入(inject)从 Hibernate HQL 到 MySQL 的删除/删除

mysql - node.js 的 mysql 模块中的 'OkPacket'

ruby-on-rails - SearchKick中的日期范围查询( Elasticsearch )

ruby - Heroku Postgres Ruby Puma worker 和线程

ruby-on-rails - 如何在 RSpec 规范中 stub 闪存?

ruby-on-rails - 如何在 Rails 中选择字段值最低的记录

c# - 使用 mysql 作为数据库的文本框自动完成

java - 如何计算商会号码之间的相似度?

ruby-on-rails - 前端和后端应该由不同的 Controller 处理吗?

ruby-on-rails - Rails 中的一个 Controller 有多个数据库表