您可能已经注意到Bo.lt等服务允许您编辑网站并显示结果。据我所知,他们首先复制了一个网站的
喜欢在http://lll.bo.lt/ev5ct
因此,我的问题是,为了实现它,从页面中提取所有页面或DOM,并将其复制到我的服务器(包括子文件)的最佳实践是什么?
我知道这听起来是个大问题,但我只需要在php/javascirpt
@Frank Farmer说得对。您还可以编写一个小蜘蛛来索引链接、抓取链接并存储它们。这将为您提供学习如何做到这一点的练习。
我使用了CURL,而且速度更快、更容易。