PHP数组到solr索引


php arrays into solr index

我一直在使用mysql只是为了练习获取数据存储。我要做的是获取html文档的textnodes,它相对于文档的y坐标,以及url。我想知道如何在solr中直接执行此操作(因为它使用xml)。一些一般性的指导也会很好。

for($i=0; $i<count($textnode); $i++) {
$textnode[$i] = stripslashes($textnode[$i]);
$textnode[$i] = mysql_real_escape_string($textnode[$i], $con);

 mysql_query("INSERT INTO paragraphs (paragraphs, ytext, url)
 VALUES ('$textnode[$i]','$ytext[$i]', '$url')");

}

在php脚本中使用一个可用的xml文档库(不止一个,最简单的可能是SimpleXML)。solr的XML格式在他们的wiki中有描述(见这里)。

然后用一些名称将字段添加到文档中(由schema.xml配置)。并将其发布到solr接口。

参见使用curl的示例。PHP也有一个curl库。所以你可以轻松实现任何东西