www.Bo.lt,或如何复制包括儿童文件在内的整个网页


www.Bo.lt, or how to make a copy a entire webpage including children files

您可能已经注意到Bo.lt等服务允许您编辑网站并显示结果。据我所知,他们首先复制了一个网站的

喜欢在http://lll.bo.lt/ev5ct

因此,我的问题是,为了实现它,从页面中提取所有页面或DOM,并将其复制到我的服务器(包括子文件)的最佳实践是什么?

我知道这听起来是个大问题,但我只需要在php/javascirpt

中定位是否可行

@Frank Farmer说得对。您还可以编写一个小蜘蛛来索引链接、抓取链接并存储它们。这将为您提供学习如何做到这一点的练习。

我使用了CURL,而且速度更快、更容易。