如何以编程方式登录媒体维基网站


How to login programmatically to mediawiki website

你好 有一个使用 MW 1.18.2 构建的网站,它要求用户登录 - 没有这个,您将无法访问其中的任何页面。我有从浏览器手动登录的有效凭据,但我需要能够从我的 Windows 窗体应用程序 (C#) 执行相同的操作:当用户单击按钮时,我必须显示(或导航到)网站中的某个页面,为此我必须首先以编程方式登录。我已经在 PHP 和 JScript 中找到了这些示例,但作为该 Web 工作人员的新手,我不知道如何使用它们,我不确定它们可以在客户端使用。

任何帮助将不胜感激。

网站身份验证往往按如下方式工作:

  1. 用户(通过 HTTP POST 操作)向服务器提交凭据
  2. 如果凭据正确,服务器将使用会话令牌和可能的其他 Cookie 令牌进行响应。浏览器存储这些内容,并在每次请求时将它们返回给服务器。

也许最简单的选择是以编程方式在 WebBrowser 控件中填写表单并提交。此处讨论了执行此操作所需的步骤。主要步骤是确定要操作的表单元素(用户名和密码字段),所有这些都可以使用大多数Web浏览器中可用的各种开发人员工具完成。

另一种选择是使用 HttpClient 提交登录详细信息,然后将收到的会话和 cookie 数据传递给 WebBrowser 控件。查看维基百科,登录字段似乎通过 POST 提交:

URL: https://en.wikipedia.org/w/index.php?title=Special:UserLogin&action=submitlogin&type=login&returnto=Main+Page
wpName: <username>
wpPassword: <password>
wpRemember: 1|0
wpLoginAttempt: Log in
wpLoginToken: <a token from a hidden form input>
wpForceHttps: 0

我通过使用网络标签下的谷歌浏览器的开发人员工具(按 F12)来解决这个问题。如果您提交表单,您通常可以找到包含表单信息的 POST 请求(与大多数 HTTP GET 请求相反)。

您在这里遇到的最大问题可能是表单中的隐藏令牌。我想从登录表单以外的任何地方停止自动登录是存在的。如果mediawiki默认使用它,那么如果你不控制mediawiki的安装,就没有简单的方法来绕过它。此时,您不妨只使用第一种方法(因为您必须访问 DOM 才能获取令牌)。

谢谢LeoR,它有效:

private void buttonLoginAndShowMainPage_Click(object sender, EventArgs e)
    {
        this.webBrowser1.Navigate(mediawikisite);
    }
    private void webBrowser1_DocumentCompleted(object sender, WebBrowserDocumentCompletedEventArgs e)
    {
        HtmlDocument doc = this.webBrowser1.Document;
        HtmlElement LoginForm = doc.Forms[0];
        HtmlElement UserName = doc.GetElementById("wpName1");
        HtmlElement Password = doc.GetElementById("wpPassword1");
        UserName.SetAttribute("value", "myuserid");
        Password.SetAttribute("value", "mypassword");
        LoginForm.InvokeMember("submit");
    }