维基词典-我无法获得本地工作副本


wiktionary - I cannot get a local working copy

我要第一个承认我不是世界上最聪明的人,但是我在这一点上很困惑。

我想访问英语维基词典项目的单词和每个单词的详细信息。我看到他们做数据转储,非常兴奋。这只持续了3秒。从那以后,我所做的就是在沮丧和愤怒的时候咒骂和抽烟。

我用的是windows 7。
我已经安装了最新版本的xampp(64位,安装在根目录下)。我已经安装了最新的Java DK。
我已经将Xampp和JDK设置为以管理员身份运行。我已经拿到了文章页文件。
我已经解压了。
我使用了mwxml2sql工具。
我无法让它运行(无论我尝试了什么设置/标志)。
我使用了GUI版本的mwxml2sql工具。
它运行-然后在4300行时出现错误。
错误是关于name_title中的双键。

我看过维基百科,但它似乎落后了几年。

我不知道。

我已经查看了在重复键错误之前进入DB的数据。
我可以看到一些Blob格式的数据。
如何通过php访问这些信息?

没有一个像样的(如"白痴":D)指南吗?
我真的需要获取所有文件,安装wiki,解析文件吗?
我打算如何处理欺骗键问题(不像我可以打开sql文件并找到相关行!)?

那么,请-有人这样做或知道一种方法吗?
我唯一能想到的就是试着把这个网站刮掉——我宁愿不这么做(维基组也不会这么做)。

如果是相关的-我特别关注词形,词序,发音,定义,任何短语和相关单词。像词源之类的东西会很好,但不是那么重要。

如果建议的话,是的,我看过WordNet(设法找到mysql转储,并使其工作)。我也见过像MRC和CMU词典这样的资源,但都没有正确的权限。这就是为什么维基词典看起来如此有吸引力。但似乎格式/转储远不友好:(

那么,有什么帮助或想法吗?替代资源、指南、演练……这些都有帮助。
或者,如果你能告诉我是什么导致错误,如何绕过它,以及如何访问字数据,这将是极好的。

真诚的你-沮丧

我看过维基百科,但它似乎落后了几年。

不,wikokit项目还活着:)链接:https://github.com/componavt/wikokit

您可以下载解析后的英文维基词典数据库:http://whinger.krc.karelia.ru/soft/wikokit/index.html将SQL转储文件上传到MySQL,并使用从英文维基词典中提取的定义、同义词和翻译。