搜索html表并用php编写特定的行/列


Search html table and write specific row/column with php

我制作了一个代码,从另一个网站读取一个表并将其写在我的网站上。现在我只想阅读特定的行/列,并将其写在我的网站上。该表充满了天气数据,每5分钟刷新一次。我只需要整小时和半小时的值,而不是一行中的所有值,只需要温度。例如,每五分钟有一行包含温度值、湿度、太阳辐射等。我需要找到一个值,比如05:00,并只读取/写入该行的温度列。在这种情况下,温度为:05:00 12.5°C。我需要48个值,因为每天有24小时,再加上另外24个半小时,总共是48个,对吧。。

这是我代码的一部分:

<?php
$trazi = ':00';
$citaj = file('proba.txt');
foreach($citaj as $linija)
{
  if(strpos($linija, $trazi) !== false)
   echo $linija;
}
$traziURL = "somepage";
$stranica = file_get_contents($traziURL);
$tablica = '/(<table.*<'/table>)/s';
preg_match_all($tablica, $stranica, $zeit);
echo $zeit[0][0];
$ime = "proba.txt";
$table = fopen($ime, 'w') or die ("Error!");
$podaci = $zeit[0][0];
fwrite($table, $podaci);
fclose($table);
?>

它可能对你不起作用,因为有些零件缺失了,但只是给你一个想法。

我相信还有多种其他方法可以做到这一点,但我会这样做。

<?php
/**
 * @author Bart Degryse
 * @copyright 2013
 */
function getData() {
  //Get the html page
  $url = "http://www.essen-wetter.de/table.php";
  $content = file_get_contents($url);
  //Turn it into a dom document searchable by xpath
  $dom = new DOMDocument();
  $dom->loadHTML($content);
  $xpath = new DOMXPath($dom);
  //Get field names
  $query = "//tr/td[position()=1 and normalize-space(text()) = 'Zeit']";
  $entries = $xpath->query($query);
  $entry = $entries->item(0);
  $tr = $entry->parentNode;
  foreach ($tr->getElementsByTagName("td") as $td) {
    $fieldnames[] = $td->textContent;
  }
  //Get field data
  $query = "//tr/td[position()=1 and (substring-after(normalize-space(text()),':') = '00' or substring-after(normalize-space(text()),':') = '30')]";
  $entries = $xpath->query($query);
  foreach ($entries as $entry) {
    $fieldvalues = array();
    $tr = $entry->parentNode;
    foreach ($tr->getElementsByTagName("td") as $td) {
      $fieldvalues[] = $td->textContent;
    }
    $data[] = array_combine($fieldnames, $fieldvalues);
  }
  //Return data set
  return $data;
}
//Gather the data
$data = getData();
//Do something with it
echo "<pre>'n";
foreach ($data as $row) {
  echo "Temperature at {$row['Zeit']} was {$row['Temperatur']}.'n";
}
echo "</pre><hr><pre>'n";
print_r($data);
echo "</pre>'n";
?>

如果要在UTF-8兼容的终端上或声明为UTF-8编码的网页上显示数据,那么就应该这样做。如果你想使用单字节ISO-8859-1编码,你必须更改这一行:

    $fieldnames[] = $td->textContent;

进入这个:

    $fieldvalues[] = utf8_decode($td->textContent);

备注请注意,虽然从技术上讲,这样做在法律上并没有那么难,但你的处境很艰难。该页面上的数据版权归Markus Wolter所有。未经其同意将其数据用于自己的目的被视为盗窃。