假设你在⼀篇英⽂⼩说⾥查找 hi ,你可以使⽤正则表达式 hi 。 这⼏乎是最简单的正则表达式了,它可以精确匹配这样的字符串: 由两个字符组成,前⼀个字符是h, 后⼀个是i 。通常,处理正则表达式的⼯具会提供⼀个忽略⼤⼩写的选项,如果选中了这个选项,它可以 匹配 hi , HI , Hi , hI 这四种情况中的任意⼀种。
不幸的是,很多单词⾥包含 hi 这两个连续的字符,⽐如 him , history , high 等等。⽤ hi 来查找的话, 这⾥边的 hi 也会被找出来。如果要 精确地查找hi这个单词 的话,我们应该使⽤ \bhi\b 。 \b 是正则表达式规定的⼀个特殊代码(好吧,某些⼈叫它 元字符,metacharacter ),代表着 单词 的开头或结尾,也就是单词的分界处 。虽然通常英⽂的单词是由空格,标点符号或者换⾏来分隔的,但 是 \b 并不匹配这些单词分隔字符中的任何⼀个,它只匹配⼀个位置。