根据用户对项目进行分类的统计信息来选择正确类别的算法


algorithm to select right categories based on statistics how users categorized items

我有一个类别有限的系统(大约20个)。每个用户都可以将这些类别分配给系统中的项目(让我们称之为user categories)。现在我想介绍一下所谓的system categories,即根据用户对物品的分类统计来分配给物品的类别。我面临的问题是如何在以下情况下选择正确的类别:

item 1
cat A - 10 users
cat B - 7 users
cat C - 1 users
cat D - 0 users

在上面,项目1的system categories应该是:A、AB还是ABC?

或者另一种情况:

item 2
cat A - 10 users
cat B - 10 users
cat C - 10 users
cat D - 5 users

编辑:在浏览了SO之后,我认为这可以使用轮盘选择遗传算法来解决

我在Detect trending中回答了一个类似的问题"反应";(一个或多个)在一篇文章中(像Buzzfeed和其他人),声明我会在这方面使用模糊逻辑。

我只想向大家明确一点,遗传算法是一种使用模拟进化(主要是繁殖和突变)的算子的优化方法,而roulete wheel是一种用于选择将应用这些算子的当前解决方案的技术。尽管遗传算法已经被用于分类问题,但我相信它们不是你目前所寻求的。

我想你可能对"选择"一词的用法感到困惑,但我不相信遗传算法及其选择技术都不适用于此。