一组字符串之间的相似性百分比


Percentage similarity between a set of strings

我正在尝试计算输入字符串和给定字符串集合之间的百分比相似性。 我见过使用汉明距离和列文施泰因距离的例子。但这些只考虑了两个刺痛。

我的问题:是否可以一次计算多个刺痛的上述内容?(我有一组存储的字符串,我得到了一个新的输入刺痛,我想找出旧的刺痛与新的刺痛有多相似,或者匹配的刺痛说 90%)。我相信汉明距离是合适的,因为所有的琴弦都是相等的。

例如:假设输入:A T T A C G C T

         Existing: A A T T G T C
                   A C T T G T C
                   C A T T G T C

虽然有许多类似的问题得到了回答,但我无法找到一个考虑到这一点的问题。也许有人可以帮忙。

提前感谢!

你可以使用这个: levenshtein

检查文档以获取示例,希望对您有所帮助。