正则表达式,用于用 HTML 锚点替换关键字,避免嵌套锚点


Regular expressions to replace keywords by HTML anchors avoiding make nested anchors

仅替换不在锚点内的关键字:

// replace
... keyword ...  -> ... <a href="url">keyword</a> ...
// not replace
...<a href=""> ... keyword ... </a>...  -> ...<a href=""> ... keyword ... </a>...

请提供合适的模式来完成此操作。

注意:我正在处理字符串类型变量,而不是HTML文档!


编辑:好的,好的。我将使用HTML解析器,谢谢!

正则表达式不能可靠地用于做这种事情,因为HTML不是一种常规语言。如果使用像 JSoup 这样的解析器将字符串变量处理成 DOM,然后将结果序列化回字符串,则可以获得可靠的结果。