用于过滤不适当内容的PHP脚本或API


PHP script or API for filtering inappropriate content

我经营一个网站,有抱负的作家可以在这里发表他们的作品。当然,这类文章的一些内容可能是"敏感"的。有时它包含很多脏话,有时它是恶意的,有时它是自杀。这不是常态,但确实存在。

当然,我们希望我们的用户可以自由地发布他们喜欢的内容,但问题出现在广告商身上。也就是Google Adsense,它会定期向我们发送警告,提醒我们内容中含有太多脏话或诽谤。最新的是一篇有人写的关于自残的文章,谷歌认为这篇文章太"悲剧"了。

我通常也能写剧本,通过文本,发现很多脏话或种族主义术语或反同性恋的言论,等等。但是我怎么也不知道如何检测"悲剧性"文本。

问题是2倍

  1. 是否有某种PHP类/函数/API擅长检测不适当的内容?
  2. 关于如何自动检测自杀或自残内容有什么想法吗?

你可以训练一个贝叶斯过滤器来判断悲剧的内容是什么样的。就像垃圾邮件过滤器一样,但是针对的是你想要屏蔽的内容。我已经使用了这个PHP库,它工作得很好:https://github.com/Dachande663/PHP-Classifier