抓取网页内的表


Scrape table within a webpage?

我目前正在尝试从网页内的表格中抓取所有结果。目前,我正在尝试使用file_get_contents()和一些jquery,但我似乎无法使用jQuery在DOM中找到选择器。

我正在尝试逐行获取它们,因为我打算将它们插入我的数据库以备将来使用。

我的问题是,我将如何获取网页表格中每个<tr>中每个<td>的值,以便将所有这些值插入我的数据库?

.PHP:

控制器

function scqf_stats(){
    $data['stats'] = file_get_contents("http://www.scqf.org.uk/Search%20The%20Database?ssub=&stit=Enter+a+title+or+a+part+of+it&sown=Start+typing+and+select+from+dropdown&sownid=&slev=&scrb=&sk=&submitsp=Search");
    $data['main_content'] = 'alt_test';
    $this->load->view('templates/single_view', $data);
}

视图

<pre>
<script src="<?php echo base_url() ?>js/scrape.js"></script>
<?php print_r($stats); ?>
</pre>

j查询:

$(document).ready(function() {
function scrape_it(){
    $('#search-database-results').children('tbody').children('tr').each(function (){
        $this = $(this);
        $('tr').children('td').each(function() {
            var text = $('td').text();
            console.log(text);
        });   
    });
}
scrape_it();
});

假设您在id=search-database-results元素中抓取了页面,这应该可以查找表中每个TR中的所有TD(按顺序):

$(document).ready(function() {
    function scrape_it(){
        $('#search-database-results tr td').each(function() {
            var text = $(this).text();
            console.log(text);
        });
    }
    scrape_it();
});

如果您需要更多/不同,请更详细地解释。