什么是正则表达式
正则表达式就是用一个“字符串”来描述一个特征,然后去验证另一个“字符串”是否符合这个特征。简单的一个例子:用字符串 ”a” 来验证字符串 s 是否是 ”a”,形如 s.match(“a”)。概括来说有以下作用:
-
验证字符串是否符合指定特征,比如验证是否是合法的邮件地址。
-
查找字符串,从一个长的文本中查找符合指定特征的字符串,比查找固定字符串更加灵活。
-
替换字符串,比普通的基于字符串的替换更灵活。
字母、数字、汉字、下划线、以及后续没有特殊定义的标点符号,都是”普通字符”。表达式中的普通字符,在匹配一个字符串的时候,匹配与之相同的一个字符。如:表达式 “a”,在匹配字符串 “abcde” 时,匹配到的内容是:“a”。
转义字符一些不便书写的字符,采用在前面加 “\” 的方法。常见的如:
-
\r: 回车
-
\n: 换行符
-
\t: 制表符
-
\: “\” 本身
此外,还有其他再正则中有特殊用处的标点符号,在前面加 “\”后,代表该符号本身。如:^, “ 字符,需要写成 “\^” 和 “$”。如
-
\^: 匹配^符号本身
-
\$: 匹配$符号本身
-
\.: 匹配小数点. 本身