WordPress网站上的DOMDocument导致UTF-8问题


DOMDocument on WordPress site causing UTF-8 issues

我正在https://mobile.pugetsoundbasketball.com建立一个移动网站。

在主页(https://mobile.pugetsoundbasketball.com)上,我使用DOMDocument从位于主网站(https://pugetsoundbasketball.com)的页面上的特定div (#upcoming_league_dates)提取内容。

主网站是用WordPress构建的,我不想在移动网站上使用WordPress,因为我只需要拉几个WordPress页面。

$url = "https://pugetsoundbasketball.com/index.php";
$doc = new DomDocument('1.0', 'UTF-8');
$doc->validateOnParse = true;
$doc->loadHtml(file_get_contents($url));
$div = $doc->getElementById('upcoming_league_dates');
echo $doc->saveHTML($div);

这可以工作,但我的问题是它显示的是我认为是UTF-8字符,如"Men - s"而不是"Men's"。

我试着改变WordPress中的文本,看看我是否能解决这个问题,但没有运气

告诉DOM从一开始就使用什么字符集:

$doc = new DOMDocument('1.0', 'UTF-8');  // note the UTF-8 option.
$doc->loadHTML(file_get_contents($url));