如何使用 PHP 自动为文本创建标签


How to create tags for a text automatically with PHP?

我想自动为我的内容创建标签。将有一个恒定的标记列表,机器人应创建与之相关的标记。我该怎么做?你知道这方面的课程吗?任何建议将不胜感激!

谢谢!

你需要标签有多好?

你可以简单地计算n-gram词频。例如,通过一些调整,这可以创建完全有效的标签以用于博客文章。

如果您正在寻找更高级的内容,并且您有一个文档语料库,您可以使用TF*IDF(术语频率,反向文档频率)。这将显示 1 个文档中提到的有意义的关键字,因为它们不可能出现在其他文档中。只要您的语料库足够大,它就会给你带来好的结果。

一种捷径方法可能是标识内容的相关部分(标题、类别、来源?),并改用类似的东西。

此外,雅虎还有一个术语提取API,您可能会觉得很有趣。