我正在处理此URL末尾的pdf
https://www2.blackrock.com/webcore/litService/search/getDocument.seam?venue=PUB_INS&source=CONTENT&serviceName=PublicServiceView&ContentID=51648
通过查看它,我们可以看到它是12/31/2012
版。有没有办法在pdf本身上获取一些时间戳数据?上传日期,创建日期,修改日期,该球场中的任何内容?
我已经尝试了以下方法,并且都返回12/31/1969
$pdfURL = 'https://www2.blackrock.com/webcore/litService/search/getDocument.seam?venue=PUB_INS&source=CONTENT&serviceName=PublicServiceView&ContentID=51648';
$rawPDF = file_get_contents($pdfURL);
echo date("F d Y H:i:s.", filemtime($pdfURL));
-AND-
echo date("F d Y H:i:s.", filemtime($rawPDF));
我也试过
$headerArray = array();
$headerArray = get_headers($pdfURL, 1);
echo "<PRE>";
var_dump($headerArray);
echo "</PRE>";
但是Last-Modified
标头数组中不存在
我之前回答过,因为我只提供了一个链接,版主删除了我的答案并转换为评论。现在让我们根据我们的评论尝试更完整的答案:
根据我的分析,给定链接的 HTTP 标头包含上次修改字段。但前提是链接直接指向文件。但是,当您看到链接是那种somepage.pgp?file=file.pdf
时,上次修改时间将不存在。在第一种情况下,可以使用 php 函数get_headers()
来读取相关字段。我怕我帮不了你。