引言正则表达式(regularexpression)就是用一个''字符串"来描述一个特征,然后去验证另一个''字符串〃是否符合这个特征
比如表达式“ab+〃描述的特征是''一个'a'和任意个'b'”,那么'ab','abb','abbbbbbbbbb'都符合这个特征
正则表达式可以用来:(1)验证字符串是否符合指定特征,比如验证是否是合法的邮件地址
(2)用来查找字符串,从一个长的文本中查找符合指定特征的字符串,比查找固定字符串更加灵活方便
(3)用来替换,比普通的替换更强大
正则表达式学习起来其实是很简单的,不多的几个较为抽象的概念也很容易理解
之所以很多人感觉正则表达式比较复杂,一方面是因为大多数的文档没有做到由浅入深地讲解,概念上没有注意先后顺序,给读者的理解带来困难;另一方面,各种引擎自带的文档一般都要介绍它特有的功能,然而这部分特有的功能并不是我们首先要理解的
文章中的每一个举例,都可以点击进入到测试页面进行测试
闲话少说,开始
正则表达式规则1
1 普通字符字母、数字、汉字、下划线、以及后边章节中没有特殊定义的标点符号,都是"普通字符"
表达式中的普通字符,在匹配一个字符串的时候,匹配与之相同的一个字符
举例 1:表达式"c",在匹配字符串"abcde"时,匹配结果是:成功;匹配到的内容是:"c";匹配到的位置是:开始于 2,结束于 3
(注:下标从 0 开始还是从 1 开始,因当前编程语言的不同而可能不同)举例 2:表达式"bed",在匹配字符串"abcde"时,匹配结果是:成功;匹配到的内容是:"bed";匹配到的位置是:开始于 1,结束于 4
2 简单的转义字符一些不便书写的字符,采用在前面