我有一个字符串中的HTML,我正在尝试提取它并放入变量中。
.HTML
<b>App name</b>
v1.1.5 by
<a href="#">Link</a>
<br>
some description of app -
<a href="#">options</a>
<br>
<small style="color:#666">By Android market</small>
我的主要问题是某些文本不会被 HTML 标签扭曲,例如 v1.1.5 by
和 some description of app
.
如何获取内部和外部侧标签中的所有文本并将它们放在数组中?我没有尝试过任何代码,因为我不知道得到的文本没有被标签扭曲
尝试strip_tags()
+ explode()
+ array_filter()
:
<?php
// header('Content-Type: text/plain');
$str = <<<HTM
<b>App name</b>
v1.1.5 by
<a href="#">Link</a>
<br>
some description of app -
<a href="#">options</a>
<br>
<small style="color:#666">By Android market</small>
HTM;
$buffer = array_filter(explode(PHP_EOL, strip_tags($str)));
var_dump($buffer);
?>
输出:
array(6) {
[0]=>
string(8) "App name"
[1]=>
string(9) "v1.1.5 by"
[2]=>
string(4) "Link"
[4]=>
string(25) "some description of app -"
[5]=>
string(7) "options"
[7]=>
string(17) "By Android market"
}