我的SOLR中有大约 2000万文档。我在SOLR中使用DIH索引增量更新。对delta导入进行最后一个小时的索引,完整导入大约需要2-3小时,5-6小时完成。除了DIH,还有什么方法可以加快这个过程吗?
你可以考虑
- 在多个服务器上分发索引
- 在多个服务器上复制索引
分发索引:将索引分成几个部分(分片),每个部分在单独的机器上运行。然后,Solr将搜索划分为子搜索,这些子搜索在单个分片上运行,共同报告结果。这样,在对非常大的索引进行查询时,您将体验到更快的性能。
在solr
上扩展是很好的阅读http://www.hathitrust.org/blogs/large -规模search/scaling -大-规模-搜索- - 500000卷- 500万卷——和——除了