必应搜索 API 和 Azure


Bing search API and Azure

我正在尝试以编程方式在必应搜索引擎上执行搜索Microsoft。

以下是我的理解:

  • 有一个必应搜索API 2.0,即将被替换(2012年8月1日)
  • 新的API被称为Windows Azure Marketplace。
  • 您对两者使用不同的 URL。

在旧 API(必应搜索 API 2.0)中,在 URL 中指定密钥(应用程序 ID),该密钥将用于对请求进行身份验证。只要在 URL 中将密钥作为参数,就可以获取结果。

在新的API(Windows Azure Marketplace)中,您不会在URL中包含密钥(帐户密钥)。相反,您输入查询 URL,然后服务器将要求您提供凭据。使用浏览器时,会有一个弹出窗口,询问A/C名称和密码。说明是将帐户名称留空并在密码字段中插入您的密钥。

好的,我已经完成了所有这些操作,我可以在浏览器页面上看到 JSON 格式的搜索结果。

如何在 PHP 中以编程方式执行此操作?我尝试从 MSDN 库中搜索文档和示例代码Microsoft但我要么搜索错了地方,要么那里的资源非常有限。

有人能告诉我如何在PHP中进行"在弹出窗口的密码字段中输入密钥"部分吗?

提前非常感谢。

新服务的文档可能会变得有点有趣 - 特别是在MSDN的兔子沃伦中。我能找到的最清晰的解释是在此必应搜索 API 页面的迁移指南上。最棒的是,迁移指南在最后有一个很好的简单示例。

编辑:好的,迁移指南是一个起点,但它不是最好的例子。这里有两种对我有用的方法(没有代理、防火墙等干扰):

使用file_get_contents

注意:"allow_url_fopen"需要启用才能正常工作。如果不是,您可以使用ini_set(或更改 php.ini 等)。

if (isset($_POST['submit'])) 
{
    // Replace this value with your account key
    $accountKey = 'AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA=';            
    $ServiceRootURL =  'https://api.datamarket.azure.com/Bing/Search/';                    
    $WebSearchURL = $ServiceRootURL . 'Web?$format=json&Query=';
    $cred = sprintf('Authorization: Basic %s', 
      base64_encode($accountKey . ":" . $accountKey) );
    $context = stream_context_create(array(
        'http' => array(
            'header'  => $cred
        )
    ));
    $request = $WebSearchURL . urlencode( '''' . $_POST["searchText"] . '''');
    $response = file_get_contents($request, 0, $context);
    $jsonobj = json_decode($response);
    echo('<ul ID="resultList">');
    foreach($jsonobj->d->results as $value)
    {                        
        echo('<li class="resultlistitem"><a href="' 
                . $value->URL . '">'.$value->Title.'</a>');
    }
    echo("</ul>");
}

使用 cURL

如果安装了 cURL,这几天很正常:

<?php
  $query = $_POST['searchText'];
  $accountKey = 'AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA';
  $serviceRootURL =  'https://api.datamarket.azure.com/Bing/Search/';  
  $webSearchURL = $serviceRootURL . 'Web?$format=json&Query=';
  $request = $webSearchURL . "%27" . urlencode( "$query" ) . "%27";
  $process = curl_init($request);
  curl_setopt($process, CURLOPT_HTTPAUTH, CURLAUTH_BASIC);
  curl_setopt($process, CURLOPT_USERPWD,  "$accountKey:$accountKey");
  curl_setopt($process, CURLOPT_TIMEOUT, 30);
  curl_setopt($process, CURLOPT_RETURNTRANSFER, TRUE);
  $response = curl_exec($process);
  $response = json_decode($response);
  echo "<ol>";
  foreach( $response->d->results as $result ) {
    $url = $result->Url;
    $title = $result->Title;
    echo "<li><a href='$url'>$title</a></li>";
  }
  echo "</ol>";
?>

[WTS] 将 SearchWeb 更改为 Search。

以上

都不适合我。我正在运行 MAMP,这可能是相关的。请尝试以下操作:


$accountKey = '=';

function sitesearch ($query, $site, $accountKey, $count=NULL){
  // code from http://go.microsoft.com/fwlink/?LinkID=248077
    $context = stream_context_create(array(
    'http' => array(
      'request_fulluri' => true,       
      'header'  => "Authorization: Basic " . base64_encode($accountKey . ":" . $accountKey)
    ) 
    )); 
    $ServiceRootURL =  'https://api.datamarket.azure.com/Data.ashx/Bing/Search/v1/News?Market=%27en-GB%27&';
    $WebSearchURL = $ServiceRootURL . '$format=json&Query=';  
    $request = $WebSearchURL . urlencode("'$query'"); // note the extra single quotes
    if ($count) $request .= "&'$top=$count"; // note the dollar sign before $top--it's not a variable!
    return json_decode(file_get_contents($request, 0, $context), true);
}

$q = "query";
if ($q){
  // get search results
  $articles = sitesearch ($q, $_SERVER['HTTP_HOST'], $accountKey , 100);
  foreach($articles['d']['results'] as $article) {
      echo " <p>".$article['Title'].'</p>';
      echo " <p>".$article['Description'].'</p>';
      echo " <p>".$article['Source'].'</p>';
      echo " <p>".strtotime($article['Date']).'</p>';
  }

}

从:http://bililite.com/blog/2012/06/05/new-bing-api/

您可以使用

以下代码获取必应搜索结果

$acctKey = 'Your account key here';
$rootUri = 'https://api.datamarket.azure.com/Bing/Search';
$query = 'Kitchen';
$serviceOp ='Image';
$market ='en-us';
$query = urlencode("'$query'");
$market = urlencode("'$market'");
$requestUri = "$rootUri/$serviceOp?'$format=json&Query=$query&Market=$market";
$auth = base64_encode("$acctKey:$acctKey");
$data = array(  
            'http' => array(
                        'request_fulluri' => true,
                        'ignore_errors' => true,
                        'header' => "Authorization: Basic $auth"
                        )
            );
$context = stream_context_create($data);
$response = file_get_contents($requestUri, 0, $context);
$response=json_decode($response);
echo "<pre>";
print_r($response);
echo "</pre>";

http://www.guguncube.com/2771/python-using-the-bing-search-api

它包含用于查询Bing的Python代码,这是根据最新的新API(Windows Azure Marketplace)

# -*- coding: utf-8 -*-
import urllib
import urllib2
import json
def main():
    query = "sunshine"
    print bing_search(query, 'Web')
    print bing_search(query, 'Image')
def bing_search(query, search_type):
    #search_type: Web, Image, News, Video
    key= 'YOUR_API_KEY'
    query = urllib.quote(query)
    # create credential for authentication
    user_agent = 'Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Trident/4.0; FDM; .NET CLR 2.0.50727; InfoPath.2; .NET CLR 1.1.4322)'
    credentials = (':%s' % key).encode('base64')[:-1]
    auth = 'Basic %s' % credentials
    url = 'https://api.datamarket.azure.com/Data.ashx/Bing/Search/'+search_type+'?Query=%27'+query+'%27&$top=5&$format=json'
    request = urllib2.Request(url)
    request.add_header('Authorization', auth)
    request.add_header('User-Agent', user_agent)
    request_opener = urllib2.build_opener()
    response = request_opener.open(request) 
    response_data = response.read()
    json_result = json.loads(response_data)
    result_list = json_result['d']['results']
    print result_list
    return result_list
if __name__ == "__main__":
    main()

不要忘记把这个:

base64_encode("ignored:".$accountKey)

而不是:

base64_encode($accountKey . ":" . $accountKey)

下面是搜索 API 的工作示例,只需将"XXXX"替换为您的访问密钥即可。即使我浪费了相当多的时间试图让它使用 cURL 工作,但由于本地:(上的"CURLOPT_SSL_VERIFYPEER"而失败 - 因此请确保您的 cURL 选项设置正确。

$url = 'https://api.datamarket.azure.com/Bing/Search/Web?Query=%27xbox%27';
$process = curl_init($url);
curl_setopt($process, CURLOPT_HTTPAUTH, CURLAUTH_BASIC);
curl_setopt($process, CURLOPT_USERPWD, base64_encode("username:XXXX"));
curl_setopt($process, CURLOPT_TIMEOUT, 30);
curl_setopt($process, CURLOPT_RETURNTRANSFER, TRUE);
curl_setopt($process, CURLOPT_SSL_VERIFYPEER, false);
$response = curl_exec($process);
# Deliver
return $response;
# Have a great day!
curl_close($process);

下面是如何使用 Unirest 库调用 Bing/Azure API 的示例。

require_once '/path/to/unirest-php/lib/Unirest.php';
$accountKey = "xxx";
$searchResults = Unirest::get("https://api.datamarket.azure.com/Bing/Search/v1/Composite",
    array(),
    array(
        'Query' => '%27Microsoft%27',
        'Sources' => '%27web%2Bimage%2Bvideo%2Bnews%2Bspell%27',
        '$format' => 'json',
    ), $accountKey, $accountKey
);
// Results are here:
$objectArray = $searchResults->body->d->results;
$rawJson = $searchResults->raw_body;

您可以通过在 URL 中定义参数来省略Source参数:https://api.datamarket.azure.com/Bing/Search/v1/Webhttps://api.datamarket.azure.com/Bing/Search/v1/Image

注意:请求 URL 中的参数区分大小写。对于必应,它们以大写字母开头。