我正在编写一个函数,该函数将从基本URL抓取所有URL,读取每个页面的html内容,并将搜索findout
和login
页面url
的"form
"标记,并且应该应用凭据来继续抓取已验证的页面。
到目前为止,我可以读取每个页面的html内容,并获得表单属性,如方法(即post/get)和操作。
现在,我想检查"form
"标记内部是否有任何"input
"标记,以获取它们的属性,如名称,以应用凭据,并应触发提交按钮。如果我使用
$doc->loadHTML($html_data); $inputtags= $doc->getElementsByTagName('input');
我将从页面中获取所有输入标签。
但是我只需要从表单标签中获取输入标签。
提前谢谢。
使用simple dom parser
可以做到这一点,selector
的工作原理与jquery
相同,这将帮助您在侧form
中获得input
元素
请查看此链接http://simplehtmldom.sourceforge.net/