简单的HTML dom PHP和纯文本的新行


simple html dom php and new lines in plaintext

当我解析一个站点并打印出明文时,我在打印输出中得到了许多不能通过str_replace删除的换行字符。

例如,如果我解析eBay并查找结束时间,

$ebayEndTime = $this->html_simple_dom->find( 'span[class=vi-tm-left]', 0 )->plaintext;
在打印出来的文件中,它看起来像这样:

' t ' t ' ' ' t(2013年3月19日' n ' t ' t ' ' ' t15:10:11 PDT) ' n ' t ' ' t

试图删除它没有效果:

$search = array(''n', ''t', ''r');
error_log("end time:" .  str_replace( $search, " ", $ebayEndTime));

仍然导致:

' t ' t ' ' ' t(2013年3月19日' n ' t ' t ' ' ' t15:10:11 PDT) ' n ' t ' ' t

我需要做些什么来删除换行/制表符?我甚至试着把这个做得彻底:

$search = array(''n', ''t', ''r', '''n', '''t', '''r', '''''n', ''''t', ''''r', '''''n', '''''t', '''''r');

我知道Java要求转义字符被转义,但是当它在日志文件中打印时,它是否像使用'''的html代码一样打印出来?

如何:

$str = "'t't't't't(Mar 19, 2013'n't't't't't15:10:11 PDT)'n't't't";
echo trim(preg_replace('/'s+/', ' ', $str));
#=>(Mar 19, 2013 15:10:11 PDT)