在超过1000页的PDF文件中搜索文本


Searching a text in PDF file which is having more than 1000 pages

我正在开发一个网站。我想在pdf文件中搜索一个搜索字符串,并在网站上显示结果。PDF文件可用,当用户输入一些文本进行搜索时,应显示结果。我尝试过使用"pdf对象",但这不是我想要做的事情。我需要的不是在网站上查看pdf,而是搜索pdf。

Libpoppler可以提供帮助。它解析PDF。

Libpoppler附带了pdftotext命令行实用程序,它可能适合您的用途(它包含在Debian包poppler-utils中)。然而,更好的可能是pdfgrep,一种在PDF文件中搜索文本的工具,它没有随Libpoppler一起提供。所有这些都可以在Debian中找到,也许还有其他地方。