PHP Simple HTML DOM Parser拒绝处理〔无效〕HTML-第一次尝试失败


PHP Simple HTML DOM Parser denies to handle [invalid] HTML - first trial fails

g亲爱的社区-大家好!

好吧,我正试图使用PHP Simple HTML DOM Parser来选择一个类或一个id,但绝对没有运气。也许我不得不一次又一次地研究手册。

DOM技术有点让我难以理解:但我的例子很简单,似乎符合手册中给出的例子(simplehtmldom.sourceforge AT net/manual.htm),但它就是不起作用,它让我很头疼。使用简单dom给出的其他示例脚本也可以正常工作。

参见示例:http://www.aktive-buergerschaft.de/buergerstiftungsfinder

这是我发现的最简单的例子。。。问题是——如何解析它?

我应该用Perl来做吗?示例HTML页面是无效的HTML。我不知道SimpleHTMLDOMParser是否能够处理格式错误的HTML(可能不是)。然后我就迷路了。

好吧:这很难相信——但你可以用file_get_contents获得内容:但之后你必须做解析器的工作!我有一些缺失的部分!

最后:如果我不能运行它,我可以尝试一些Perl解析器,例如HTML::TreeBuilder::XPath

1:检查file_get_contents是否工作!!!!

2:如果没有,请使用curl、fopen或telnet读取数据。

简单的Html-Dom过滤所有的噪音也可以处理格式错误的标签。。。

数据检索可能存在问题