自动爬行/抓取过程输出到.txt文件使用php, javascript或cURL(内部测试)


Automated crawling/scraping process output to .txt file using php, javascript or cURL (internal pentest)

这是一个在黑暗中拍摄的问题,建议和专业知识对于像我这样的初学者来说有点像学习曲线,我希望在一个自定义编码的应用程序上运行一个小的内部测试。

url参数是这样的:uid=1001,连续到uid=380412作为事情站在目前,我想做的是有一个脚本抓取网站从mysite.com/index.php?uid=1001到mysite.com/index.php?uid=380412,并将输出文件保存到一个连续的文本文件,例如,将有一个抓取的文件夹名称(输出),在那里将有连续的文本文件到uid页面抓取。

所以在(输出)文件夹1001.txt将是uid=1001记录的输出。

我已经使用cURL命令,但作为一个新手,我无法自动化的过程,我没有时间来网站和改变每一个命令行uid和文本文件输出,例如:

curl——insecure https://removed.com/index.cfm?uid=1001> eap/1001.txt以此类推,直到....Curl——不安全https://removed.com/index.cfm?uid=380412> eap/380412.txt

我这样做的原因是因为我从客户发送给我的电子邮件中发现一些页面稍微不安全,因此我需要抓取所有保存输出的页面,以便我以后可以检查问题。

小测试期间我使用cURL命令输出html,这不是一个大问题,但是只有1节在输出文件中,我关注的调查,这是客户电子邮件地址的接触,有可能有一个脚本或命令爬行网站,如果明文的电子邮件地址是可见的然后将该文件保存到. txt文件和公开的电子邮件,这将使我能够给有问题的用户发电子邮件,并实施正确的安全程序。

* *

所以总结这个问题:我基本上是在寻找一个自动化的脚本从一个特定的uid和以特定uid结束,递增uid号,然后保存输出到匹配uid号的.txt文件。如果可能的话只保存电子邮件地址或@符号所在的.txt文件呈现在HTML文件中,因为只有在那里页面才会显示是否存在电子邮件,否则页面将显示未经授权访问。

* *

bash for循环应该可以工作。

for i in {1001..380412}; do
  curl -o eap/$i.txt https://removed.com/index.cfm?uid=$i
done

(未测试)windows CMD等效。

FOR /L %G IN (1001,1,380412) DO curl -o eap/%G.txt https://removed.com/index.cfm?uid=%%G