以编程方式检查网站重定向


Checking website redirection, programmatically

在我的国家,许多网站被审查和阻止,而是被重定向到某个页面。我不知道他们到底是怎么做到的。但是,是否可以在不加载整个内容的情况下以编程方式确定网站是否被阻止或阻止?我想这样做的原因是使用网络搜索API(可能是谷歌的)并制作一个只带来未被阻止的结果的网络服务。

如果有帮助,则加载的页面内容如下所示:

<html><head><meta http-equiv="Content-Type" content="text/html; charset=windows-1256"><title>M3-5
</title></head><body><iframe src="http://10.10.34.34?type=Invalid Site&policy=MainPolicy " style="width: 100%; height: 100%" scrolling="no" marginwidth="0" marginheight="0" frameborder="0" vspace="0" hspace="0"></iframe></body></html>

我知道运行该服务的服务器必须具有我所在国家的IP。

如果有一种方法可以在PHP或Python中做到这一点,那将是最好的。

我感谢任何帮助或想法。

这在PHP和Python中都是完全可能的。基本上,您希望向相关站点发出http请求,然后分析您返回的响应。看看PHP的cURL或Python的Pycurl,看看如何发出这些http请求以及如何处理响应。

一旦你得到了响应,只需将模式与被阻止站点的一些可靠模式相匹配。我的第一个猜测是,您可以在响应中查找<body><iframe src="http://10.10.34.34?type=Invalid Site,但是您必须检查更多被阻止的页面以查看它们是否都包含该字符串。例如,如果 IP 或类型查询字符串参数因一个被阻止的站点而异,则最终可能需要将检查范围扩大到特定的正则表达式。