MongoDB-按字符串搜索GridFS文件内容


MongoDB - search GridFS file contents by string

我计划使用GridFS在MongoDB中上传用户的word文档。我必须实现以下功能。

当管理员键入一个字符串并在管理应用程序中点击搜索时,我必须列出所有内容包含搜索字符串的word文档。我必须搜索所有用户的文档。

有没有办法在MongoDB中实现这一点?如果没有,实现这一目标的最佳方式是什么?

在MongoDB中,你能做的最好的事情就是将搜索短语与GridFS中的内容进行二进制匹配,但在Word文档中,你可能找不到这个短语,因为它可能被压缩了。

我认为使用Solr这样的专用搜索解决方案会更好。Solr甚至允许你从Word文档中提取文本,并允许你用一种非常完整的搜索语言搜索任何类型的短语。看看http://wiki.apache.org/solr/ExtractingRequestHandler用于处理Word文档,例如