从标签中提取文本


Extracts text from tags

我有一个字符串中的HTML,我正在尝试提取它并放入变量中。

.HTML

<b>App name</b>
v1.1.5 by
<a href="#">Link</a>
<br>
some description of app -
<a href="#">options</a>
<br>
<small style="color:#666">By Android market</small>

我的主要问题是某些文本不会被 HTML 标签扭曲,例如 v1.1.5 bysome description of app .

如何获取内部和外部侧标签中的所有文本并将它们放在数组中?我没有尝试过任何代码,因为我不知道得到的文本没有被标签扭曲

尝试strip_tags() + explode() + array_filter()

<?php
// header('Content-Type: text/plain');
$str = <<<HTM
<b>App name</b>
v1.1.5 by
<a href="#">Link</a>
<br>
some description of app -
<a href="#">options</a>
<br>
<small style="color:#666">By Android market</small>
HTM;
$buffer = array_filter(explode(PHP_EOL, strip_tags($str)));
var_dump($buffer);
?>

输出:

array(6) {
  [0]=>
  string(8) "App name"
  [1]=>
  string(9) "v1.1.5 by"
  [2]=>
  string(4) "Link"
  [4]=>
  string(25) "some description of app -"
  [5]=>
  string(7) "options"
  [7]=>
  string(17) "By Android market"
}