为索引设置cron


Setting cron for indexing

这不是任何特定的编码问题。我想要以下theoretical的知识和观点/评论:(或者请发一个链接到一些博客,你可以引导我去!)

我正在为我的一个项目开发一个搜索工具。基本上,搜索将能够返回数据库中的几乎所有内容。为此,我想到了通过cron进行索引。

我只是个新手。我想知道在cron的索引中我需要注意哪些不同的事情?除memory size required外,还有time interval of successive cronsupdating from the last cron run

我用的是PHP

您需要确保您的索引表携带大多数数据库现在提供的最近更新的字段。在设计索引脚本时,应考虑对索引进行增量更新。假设您决定选择Solr(或直接Lucene),您将不得不在每次执行update cron脚本时重新打开索引,然后根据数据库更改添加/更新搜索记录。我建议创建一个索引副本,然后更新并使用一些自动化的测试查询,以确保操作正常,然后将其移动到活动副本。最好使用Solr而不是Zend Lucene,因为后者很难扩展。Solr作为服务器运行,为您提供了许多选项来缓存和优化搜索查询,这是我在Zend Lucene中没有看到的。