我想使用file_get_contents()从网页中提取所有教员姓名和电子邮件地址。但是我不太擅长正则表达式。有人能帮我吗。这是我想从中提取学院名称和电子邮件地址的网页链接
http://umt.edu.pk/Academics/Faculty.aspx
以下是我迄今为止所做的代码。。。
<?php
$data = file_get_contents('http://umt.edu.pk/Academics/Faculty.aspx');
$regex = '#<div class='"staff'"><div><h4>(.*)</h4></div></div>#';
preg_match($regex,$data,$match);
var_dump($match);
echo $match[0];
?>
请帮我从给定的链接中提取所有学院的名称和电子邮件地址。提前谢谢。
您可以尝试X-Path:
姓名:[@div="col-lg-8 col-md-9 col-sm-9 colxs9"]/h4
对于电子邮件:[@div="col-lg-8 col-md-9 col-sm-9 colxs9"]/p/a
我希望这将帮助你