使用简单的 HTML Dom 库从网页获取值


Getting values from webpage using Simple HTML Dom library

我正在尝试从网页中的表中获取值,为此我正在使用Simple HTML Dom库。我的代码是这样的:

include('simple_html_dom.php');
$html = file_get_html('http://www.lvbp.com/posicion.html');
$arr = array();
foreach ($html->find('tr') as $e) {
    array_push($arr, $e->innertext);
}
echo '<pre>';
print_r($arr);
echo '</pre>';
for ($i = 2; $i < count($arr); $i++) {
    str_replace("", "-", $arr[$i]);
    print_r($arr[$i]);
}

我得到这个作为输出,当print_r($arr)

Array
(
    [0] =>       EQUIPOS      J      G      P      Vent    
    [1] => 
    [2] =>       Navegantes      11      8      3      0    
    [3] =>       Tigres      11      8      3      0    
    [4] =>       Caribes      11      6      5      2    
    [5] =>       Leones      11      6      5      2    
    [6] =>       Aguilas      11      5      6      3    
    [7] =>       Tiburones      10      4      6      3.5    
    [8] =>       Cardenales      10      3      7      4.5    
    [9] =>       Bravos      11      3      8      5    
)

但是从这里我需要分别表示"纳维根特"、"11"、"8"等等......对于每个阵列位置。为此,我的最后一个代码:

for ($i = 2; $i < count($arr); $i++) {
    str_replace("", "-", $arr[$i]);
    print_r($arr[$i]);
}

但它不起作用,因为我得到这个结果:

Navegantes 11 8 3 0 Tigres 11 8 3 0 Caribes 11 6 5 2 Leones 11 6 5 2 Aguilas 11 5 6 3 Tiburones 10 4 6 3.5 Cardenales 10 3 7 4.5 Bravos 11 3 8 5 

我错过了什么?有什么帮助吗?

更新

这是我的代码基于建议的样子:

include('simple_html_dom.php');
$html = file_get_html('http://www.lvbp.com/posicion.html');
$arr = array();
foreach ($html->find('tr') as $e) {
    $narr = array();
    foreach ($e->find('td') as $vp) {
        array_push($narr, $vp->plaintext);
    }
    $arr[] = array($narr);
}

试试这个:

$arr = array();
foreach ($html->find('tr') as $e) {
 $narr=array();
 foreach($e->find('td') as $vp){
  array_push($narr,$vp->plaintext);
 }
 $arr[]=array($narr);
}

而不是:

foreach ($html->find('tr') as $e) {
    array_push($arr, $e->innertext);
}

并删除代码:

for ($i = 2; $i < count($arr); $i++) {
    str_replace("", "-", $arr[$i]);
    print_r($arr[$i]);
}

您将获得一个数组,其中键作为 tr 标签,其值作为 tr 的每个 td

这是一个缺点:

// includes Simple HTML DOM Parser
include "simple_html_dom.php";
$url = "http://www.lvbp.com/posicion.html";
//Create a DOM object
$html = new simple_html_dom();
// Load HTML from a string
$html->load_file($url);
// parse rows
foreach ($html->find('tr') as $i => $row) {
    // Skip the second empty row
    if ($i == 1)
        continue;
    // parse and print cells
    foreach ($row->find('td') as $j => $col) {
        echo $col->plaintext;
        echo "|";
    }
    echo "<hr>";
}

// Clear DOM object (needed essentially when using many)
$html->clear(); 
unset($html);

现场演示