检查两个地址是否“可能”.在php中也是一样


check if two address "might" be the same in php

我有这个地址:
Grimshaw Lane, Bollington, Macclesfield SK10 5JB,

寻找这个地址,我得到这个(从API):

Bollington Wharf, Grimshaw Lane, Bollington, United Kingdom

我知道preg_match是如何工作的,但我相信无论如何都必须比较两个相似的文本(相似,不相同),并决定它们是否相同的地址(即使它们有一点不同)。

显然没有解决方案可以让您获得100%可靠的结果,但是为什么不试试这个:通过wget将两个字符串发送到Google Maps并比较结果。谷歌已经投入了,至少,数以万计的工时来解决你所看到的问题,为什么不让他们来处理呢?

我不确定这是否有帮助,但我会考虑使用使用的组合使用爆炸创建多个字符串在一个数组和levenshtein()来比较数组()的不同元素。

这取决于你需要比较多少个数组,但是如果你只有几个(不是数千个)

Psudo代码应该是这样的:

$search_address = "Bollington Wharf, Grimshaw Lane, Bollington, United Kingdom";
$my_addresses = Array("Grimshaw Lane, Bollington, Macclesfield SK10 5JB", 
                         "Different Lane, YabbaDabbaDoo, Otherfield SK12 6BJ", 
                         ...);
$search_array = explode(',', $search_address);
$best_address = array();
$lowest_compare_value = 1000;
$lowest_compare_address = array();
foreach($my_addresses as $key => $my_address) {
   $current_address_array = explode(',', $value);
   $compare_value = 0;
   foreach(<elements in $my_address>) {
      $lowest_value = 1000;      
      foreach(<elements in $search_array) {
          $new_value = levenshtein($search_element, $my_element);
          if ($new_value < $lowest_value) { $lowest_value = $new_value; }
      }
      $compare_value += $lowest_value;
   }
   if($compare_value < $lowest_compare_value) {
      $lowest_compare_value = $compare_value
      $lowest_compare_address = $my_address;
   }
}

现在,您还应该考虑检查比较地址是否偏离太远的最大合理水平值是多少。

如前所述,这种方法需要时间,不应该在需要很多速度的应用程序中使用,或者如果你有很多本地地址。

我创建了这个实用程序,它已经为我工作了一段时间。当然,如果谷歌地图改变了他们的API接口,它将不得不被修改。

<?php
// Queries google maps for the address components
function utl_GetAddressComponents( $location )
{
    $components = file_get_contents('http://maps.google.com/maps/api/geocode/json?address='.urlencode($location).'&sensor=false');
    $output = json_decode($components);
    return $output->results[0];
}
?>
下面是我用来从命令行运行它的测试文件:
tst_MatchingAddresses.php:
<?php
require_once( "utl_GetAddressComponents.php" );
$addr1 = $argv[1];
$addr2 = $argv[2];
$gmapsResult1 = utl_GetAddressComponents( $addr1 );
$gmapsResult2 = utl_GetAddressComponents( $addr2 );
$gmapsAddr1 = $gmapsResult1->formatted_address;
$gmapsAddr2 = $gmapsResult2->formatted_address;
print("Gmap1: ".$gmapsAddr1." ----- argv[1]: ".$argv[1]."'n");
print("Gmap2: ".$gmapsAddr2." ----- argv[2]: ".$argv[2]."'n");
if ( strcmp($gmapsAddr1,$gmapsAddr2) )
{
    print("==> Addresses match!'n");
}
else
{
    print("==> Addresses DO NOT MATCH!'n");
}
?>

下面是一个示例命令行:

php tst_MatchingAddresses.php "1600 Pennsylvania Ave, Washington DC" "1600 Pennsylvania Avenue, 20500"

示例输出:

Gmap1: 1600 Pennsylvania Avenue Northwest, President's Park, Washington, DC 20500, USA ----- argv[1]: 1600 Pennsylvania Ave, Washington DC
Gmap2: 1600 Pennsylvania Avenue Northwest, President's Park, Washington, DC 20500, USA ----- argv[2]: 1600 Pennsylvania Avenue, 20500
==> Addresses match!

注意:你可以输入参数file_get_contents,用地址代替urlencode等,直接进入浏览器,它会显示json结果