使用preg_match从网页获取特定内容


Get specific content from web page with preg_match

我想从<div id="some-content"></div> 中的特定网页部分获取内容(所有css、链接等)

preg_match("/<div id=''some-content''>(.*)<'/div>/m", file_get_contents('www.xxx.com'), $output);
print_r ($output);

但返回空数组:Array ( )

怎么了?是preg_match的问题还是网页的问题?

使用DOM解析器。有无数次的人说regex的功能不足以解析HTML。

php内置的DOM解析器。这是一个不错的php DOM解析器。阅读SO传奇目录上的这条线索(当然)。