首页 理论教育 正则表达式在JavaScript网页编程中的应用

正则表达式在JavaScript网页编程中的应用

时间:2023-10-18 理论教育 版权反馈
【摘要】:有时也把正则表达式表示的特征称为“匹配模式”。正则表达式可以用来:验证字符串是否符合指定特征,比如验证是否是合法的邮件地址。以下将简单介绍正则表达式的编写规则。表3.9匹配次数举例1:表达式"\d+\.?

正则表达式在JavaScript网页编程中的应用

正则表达式(regular expression)就是用一个"字符串"来描述一个特征,然后去验证另一个"字符串"是否符合这个特征。比如表达式"ab+"描述的特征是“一个'a'和任意个'b'”,那么'ab','abb','abbbbbbbbbb'都符合这个特征。有时也把正则表达式表示的特征称为“匹配模式”。

正则表达式可以用来:

➢验证字符串是否符合指定特征,比如验证是否是合法的邮件地址。

➢用来查找字符串,从一个长的文本中查找符合指定特征的字符串,比查找固定字符串更加灵活方便。

➢用来替换字符串,比普通的替换更强大。

以下将简单介绍正则表达式的编写规则。

1.普通字符

字母、数字、汉字、下划线,以及没有特殊定义的标点符号,都是"普通字符"。表达式中的普通字符,在匹配一个字符串的时候,匹配与之相同的一个字符。

举例1:

表达式"c",在匹配字符串"abcde"时,匹配结果是:成功;匹配到的内容是:"c";匹配到的位置是:开始于2,结束于3(注:下标从0开始还是从1开始,因当前编程语言的不同而可能不同)。

举例2:

表达式"bcd",在匹配字符串"abcde"时,匹配结果是:成功;匹配到的内容是:"bcd";匹配到的位置是:开始于1,结束于4。

2.简单的转义字符

一些不便书写的字符,采用在前面加“\”的方法,见表3.5。这些字符其实我们都已经熟知了。

表3.5 转义字符(1)

还有其他一些有特殊用处的标点符号,在前面加“\”后,就代表该符号本身。比如:^、$都有特殊意义,如果要想匹配字符串中的"^"和"$"字符,则表达式就需要写成"\^"和"\$"。见表3.6。

表3.6 转义字符(2)

这些转义字符的匹配方法与“普通字符”是类似的。也是匹配与之相同的一个字符。

举例:

表达式"\$d",在匹配字符串"abc$de"时,匹配结果是:成功;匹配到的内容是:"$d";匹配到的位置是:开始于3,结束于5。

3.能够与'多种字符'匹配的表达式

正则表达式中的一些表示方法,可以匹配'多种字符'其中的任意一个字符,见表3.7。比如,表达式"\d"可以匹配任意一个数字。虽然可以匹配其中任意字符,但是只能是一个,不是多个。这就好比玩扑克牌时候,大小王可以代替任意一张牌,但是只能代替一张牌。

表3.7 匹配多种字符(1)

举例1:

表达式"\d\d",在匹配"abc123"时,匹配的结果是:成功;匹配到的内容是:"12";匹配到的位置是:开始于3,结束于5。

举例2:

表达式"a.\d",在匹配"aaa100"时,匹配的结果是:成功;匹配到的内容是:"aa1";匹配到的位置是:开始于1,结束于4。

4.自定义能够匹配'多种字符'的表达式

使用方括号[]包含一系列字符,能够匹配其中任意一个字符,见表3.8。用[^]包含一系列字符,则能够匹配其中字符之外的任意一个字符。同样的道理,虽然可以匹配其中任意一个,但是只能是一个,不是多个。

表3.8 匹配多种字符(2)

举例1:

表达式"[bcd][bcd]"匹配"abc123"时,匹配的结果是:成功;匹配到的内容是:"bc";匹配到的位置是:开始于1,结束于3。

举例2:(www.xing528.com)

表达式"[^abc]"匹配"abc123"时,匹配的结果是:成功;匹配到的内容是:"1";匹配到的位置是:开始于3,结束于4。

5.修饰匹配次数的特殊符号

前面讲到的表达式,无论是只能匹配一种字符的表达式,还是可以匹配多种字符其中任意一个的表达式,都只能匹配一次。如果使用表达式再加上修饰匹配次数的特殊符号,那么不用重复书写表达式就可以重复匹配,见表3.9。

使用方法是:"次数修饰"放在"被修饰的表达式"后边。比如:"[bcd][bcd]"可以写成"[bcd]{2}"。

表3.9 匹配次数

举例1:

表达式"\d+\.?\d*"在匹配"It costs$12.5"时,匹配的结果是:成功;匹配到的内容是:"12.5";匹配到的位置是:开始于10,结束于14。

举例2:

表达式"go{2,8}gle"在匹配"Ads by goooooogle"时,匹配的结果是:成功;匹配到的内容是:"goooooogle";匹配到的位置是:开始于7,结束于17。

6.其他一些代表抽象意义的特殊符号

一些符号在表达式中代表抽象的特殊意义,见表3.10。

表3.10 匹配边界

进一步的文字说明仍然比较抽象,下面的一些例子有助于理解。

举例1:

表达式"^aaa"在匹配"xxx aaa xxx"时,匹配结果是:失败。因为"^"要求与字符串开始的地方匹配,因此,只有当"aaa"位于字符串的开头的时候,"^aaa"才能匹配,比如:"aaa xxx xxx"。

举例2:

表达式"aaa$"在匹配"xxx aaa xxx"时,匹配结果是:失败。因为"$"要求与字符串结束的地方匹配,因此,只有当"aaa"位于字符串的结尾的时候,"aaa$"才能匹配,比如:"xxx xxx aaa"。

举例3:

表达式".\b."在匹配"@@@abc"时,匹配结果是:成功;匹配到的内容是:"@a";匹配到的位置是:开始于2,结束于4。

进一步说明:"\b"与"^"和"$"类似,本身不匹配任何字符,但是它要求它在匹配结果中所处位置的左右两边,其中一边是"\w"范围,另一边是非"\w"的范围。

举例4:

表达式"\bend\b"在匹配"weekend,endfor,end"时,匹配结果是:成功;匹配到的内容是:"end";匹配到的位置是:开始于15,结束于18。

7.影响表达式内部的子表达式之间关系的符号

表达式内部可能包含多个子表达式,一些符号可以影响子表达式之间的关系,见表3.11。

表3.11 子表达式

举例5:

表达式"Tom|Jack"在匹配字符串"I'm Tom,he is Jack"时,匹配结果是:成功;匹配到的内容是:"Tom";匹配到的位置是:开始于4,结束于7。匹配下一个时,匹配结果是:成功;匹配到的内容是:"Jack";匹配到的位置时:开始于15,结束于19。

举例6:

表达式"(go\s*)+"在匹配"Let's go go go!"时,匹配结果是:成功;匹配到的内容是:"go go go";匹配到的位置是:开始于6,结束于14。

举例7:

表达式"¥(\d+\.?\d*)"在匹配"$10.9,¥20.5"时,匹配的结果是:成功;匹配到的内容是:"¥20.5";匹配到的位置是:开始于6,结束于10。单独获取括号范围匹配到的内容是:"20.5"。

关于正则表达式的高级规则,请参考其他课程

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈