使用PHP从标签中提取内容


Using PHP to Extract Content From Tags

可能重复:
如何使用PHP解析和处理HTML?

给定一个HTML文件,如何使用PHP从文档中的每个<font>标记中提取字符串?

在这种情况下,有许多PHP库可以为您提供帮助。

SimpleXML:https://php.net/manual/en/book.simplexml.php

PHP的XML解析器:http://php.net/manual/en/book.xml.php

只需使用这些库并表示标记(在您的示例font中),就可以相应地提取字符串内容。

例如,您可以使用PHP的DOMDocument类来提取内容,如下所示:

$html = '<font>Hello</font> <font>, World!</font>';
$doc = new DOMDocument();
$doc->loadHTML( $html);
foreach( $doc->getElementsByTagName( 'font') as $node) {
    echo $node->nodeValue;
}

这将打印<font>标签的内部值,因此它将输出:

Hello, World! 

使用dom解析器。。

http://simplehtmldom.sourceforge.net/是一个例子。