如何在不使用DIH的情况下扩展SOLR索引


How to scale SOLR indexing without using DIH?

我的SOLR中有大约 2000万文档。我在SOLR中使用DIH索引增量更新delta导入进行最后一个小时的索引,完整导入大约需要2-3小时,5-6小时完成。除了DIH,还有什么方法可以加快这个过程吗?

你可以考虑

  1. 在多个服务器上分发索引
  2. 在多个服务器上复制索引

分发索引:将索引分成几个部分(分片),每个部分在单独的机器上运行。然后,Solr将搜索划分为子搜索,这些子搜索在单个分片上运行,共同报告结果。这样,在对非常大的索引进行查询时,您将体验到更快的性能。

在solr

上扩展是很好的阅读

http://www.hathitrust.org/blogs/large -规模search/scaling -大-规模-搜索- - 500000卷- 500万卷——和——除了