问题

我知道可以匹配一个单词,然后使用其他工具(例如 grep -v )颠倒匹配.但是,我想知道是否可以匹配使用正则表达式包含特定字词(例如hede)的行.

输入:

hoho
hihi
haha
hede

代码:

# grep "Regex for doesn't contain hede" Input

所需输出:

hoho
hihi
haha


解决方法

正则表达式不支持逆匹配的概念并不完全正确.您可以使用负面环顾模仿此行为:

^((?!hede).)*$

上述正则表达式将匹配任何字符串,或不包含换行符的行,包含(子)字符串"hede". 如上所述,这不是正则表达式是"好"(或应该做),但仍然,它是是可能的.

如果您还需要匹配换行符,请使用 DOT-ALL修饰符 a>(以下模式中的尾部 s ):

/^((?!hede).)*$/s

或使用内嵌:

/(?s)^((?!hede).)*$/

(其中 /.../ 是正则表达式分隔符,即不是模式的一部分)

If the DOT-ALL modifier is not available, you can mimic the same behavior with the character class [\s\S]:

/^((?!hede)[\s\S])*$/

Explanation

字符串只是一个 n 字符的列表.在每个字符之前和之后,都有一个空字符串.因此, n 字符列表将有 n + 1 个空字符串.考虑字符串"ABhedeCD":

    ┌──┬───┬──┬───┬──┬───┬──┬───┬──┬───┬──┬───┬──┬───┬──┬───┬──┐
S = │e1│ A │e2│ B │e3│ h │e4│ e │e5│ d │e6│ e │e7│ C │e8│ D │e9│
    └──┴───┴──┴───┴──┴───┴──┴───┴──┴───┴──┴───┴──┴───┴──┴───┴──┘

index    0      1      2      3      4      5      6      7

其中 e 是空字符串.正则表达式(?! hede).向前看看是否没有子串"hede"被看到,如果是这样的话,那么.(点)将匹配除换行符之外的任何字符.环视也称为零宽度断言,因为它们不会消耗任何字符.他们只是断言/验证一些东西.

所以,在我的例子中,首先验证每个空字符串,看看在消耗一个字符之前是否没有"hede". ).正则表达式(?! hede)只会执行一次,所以它被包裹在一个组中,并重复零次或多次:((?! hede)代码>.最后,输入的开始和结束被锚定以确保整个输入被消耗: ^((?! hede).)* $

正如你所看到的,输入"ABhedeCD"会失败,因为在 e3 ,正则表达式(?! hede) "hede"向前!)




相关问题推荐