我正在制作一个部落网站,我想从runescape的网站动态更新,以保持我们的部落数据是最新的。我计划制作一个PHP脚本,我可以通过cron工作每天执行,做3件事:
- 获取网页(http://services.runescape.com/m=clan-home/clan/Quest%20Cape%20FTW)
- 解析出5div的内容
- 将这些div的值存储为5个变量,然后可以由我的其他网页访问。
:
- 我知道如何获取一个网页与
file_get_contents('http://services.runescape.com/m=clan-home/clan/Quest%20Cape%20FTW');
- 我不知道如何分离出所需的div (
#Clanstat_1 .clanstatVal
到#Clanstat_5 .clanstatVal
) - 我知道如何使变量即
$var1
,$var2
等
有谁能帮忙完成第二步吗?
你可以使用任何用PHP编写的HTML解析器。
我个人喜欢这个- PHP简单HTML DOM解析器:http://simplehtmldom.sourceforge.net/
你可以使用类似jquery的语法访问HTML中的任何元素