比较分组的大文本字段-全文搜索,SOLR,或其他


comparative grouping of large text fields - FULLTEXT Search, SOLR, or OTHER?

我在mysql数据库中有大约150,000个LARGE TEXT字段。每个TEXT字段代表大约一页的文本,从这里开始将被称为一页。

我想把这些页面分成非常相关的小组。我对如何做到这一点的想法是在mysql中使用FULLTEXT索引。我将输入文本块,并有FULLTEXT搜索排名相关性到其他页面。在FULLTEXT搜索中,文本块的大小是否有限制?

是否有其他方法来做到这一点使用PHP/mysql?我需要实现像SOLR这样的搜索引擎吗?

虽然这是一个方便的快速修复和某些小众应用程序,但mysql的全文索引有很多问题,特别是在排名和可扩展性方面。我建议实现一个简单的关键字查找搜索引擎