抓取内容获取';注意:未定义偏移';第一次加载时-刷新后修复


Scraped content getting 'notice: undefined offset' on first load - fixes after refreshing

这里的新手程序员刚刚开始学习php,并试图制作我自己的web scraper。我做了大量的搜索,似乎找不到解决方案。

我创建了一个表单,允许用户提交查询,然后从pinterest中抓取图像并显示热门内容。然而,在提交查询后的第一次加载页面时,我得到:"注意:第27行C:''examplep''htdocs''domwebcrawler.php中的未定义偏移量:0"(28&29)。刷新X次后,页面将最终加载图片。

这些行对应于我的代码行

HTML/PHP-

<html>
<head>
<link type="text/css" href="domwebcrawler.css" rel="stylesheet" media="all" />  
</head>
<body>
<form action="<?php echo $_SERVER['PHP_SELF'] ?>" method="get">
<input type="text" name="searchquery"> <input type="submit"> <br>
What do you want to search today?
<?php
include 'simple_html_dom.php';
$dom = new simple_html_dom();
@$query = $_GET["searchquery"];
if (!empty($query)) {
    $dom->load_file('http://pinterest.com/search/pins/?q=' .    urlencode($query));
    $images= $dom->find('.PinHolder img');
    $descriptions = $dom->find('.description');
    $repins = $dom->find('.RepinsCount');
?>
<div class="js-masonry" data-masonry-options='{"itemSelector": ".pins",    "columnWidth":10}'>
<?php 
    for ($i=0; $i< 20 ; $i++) {
        echo '<div class="pins">'; 
        if($images[$i])
        echo '<div class="pinimg">' . $images[$i] . '</div>';
        if($descriptions[$i])
        echo '<div class="description">'. $descriptions[$i] . '</div>';
        if($repins[$i])
        echo '<div class="repin_count">' . $repins[$i] . '</div>';
        echo '</div>';
    };
};
?>
</div>
</body>
<script src="masonry.js"></script>
<script src="jquery.js" type="text/javascript"></script>
<script src="jquery.lazyload.js" type="text/javascript"></script>
</html>

CSS

.pins {
padding: 1%;
margin:1%;
border:solid 3px black;
width: 200px;
}
.pinimg img{
width:100%;
}
.description, .repin_count {
text-align: center;
}

我认为它可能有一些原因,因为页面在加载所有刮来的内容之前就加载了?但我不确定!

欢迎所有帮助(以及对低效代码的批评)!

热烈问候

您的代码假设在$images、$descriptions和$repins的[0]位置中总是有一些东西。

使用isset来避免该消息

if($images[$i])
echo '<div class="pinimg">' . $images[$i] . '</div>';
if($descriptions[$i])
echo '<div class="description">'. $descriptions[$i] . '</div>';
if($repins[$i])
echo '<div class="repin_count">' . $repins[$i] . '</div>';

@Amal说得很对。只要确保添加isset即可。检索到的每个对象都是数组。您正在访问一个不存在的数组索引。

<?php
include 'simple_html_dom.php';
$dom = new simple_html_dom();
$query = "html";
function print_type($var){
  echo gettype($var);
  echo "</br>";
  if (is_array($var)){
    echo sizeof($var);
  }
  echo "</br>";
}
if (!empty($query)) {
  $dom->load_file('http://pinterest.com/search/pins/?q=' .    urlencode($query));
  $images= $dom->find('.PinHolder img');
  print_type($images);
  $descriptions = $dom->find('.description');
  print_type($descriptions);
  $repins = $dom->find('.RepinsCount');
  print_type($repins);
?>
<html>
<head>
<!-- put some info here-->
<title>Pinterest parser</title>
</head>
<body>
<?php
  for ($i=0; $i< 20 ; $i++) {
?>
  <div class="pins">
<?php
    if(isset($images[$i])){
?>
    <div class="pinimg">
<?php
      echo $images[$i]
?>
    </div> <!-- end pinimg -->
<?php
    }
?>
<?php
    if(isset($descriptions[$i])){
?>
  <div class="description">
<?php
      echo $descriptions[$i]
?>
  </div><!-- end description -->
<?php
    }
?>
<?php
    if(isset($repins[$i])){
?>
    <div class="repin_count">
<?php
      echo $repins[$i]
?>
        </div> <!-- end repin_count -->
<?php
   }
?>
  </div><!-- end pins-->
 <?php
  }
}
?>
</body>
</html>