perl语言正则表达式简介

上传人:xiao****1972 文档编号:83807077 上传时间:2019-03-01 格式:DOC 页数:6 大小:81.66KB
返回 下载 相关 举报
perl语言正则表达式简介_第1页
第1页 / 共6页
perl语言正则表达式简介_第2页
第2页 / 共6页
perl语言正则表达式简介_第3页
第3页 / 共6页
perl语言正则表达式简介_第4页
第4页 / 共6页
perl语言正则表达式简介_第5页
第5页 / 共6页
点击查看更多>>
资源描述

《perl语言正则表达式简介》由会员分享,可在线阅读,更多相关《perl语言正则表达式简介(6页珍藏版)》请在金锄头文库上搜索。

1、键入文字perl语言正则表达式简介正则表达式(Regular Expression)是指定模式的一种方法,这种模式对文本进行筛选,只匹配特定的字符串。一旦匹配到了一个字符串,就可以从大量的文本中将其抽取出来,或者利用另一个字符串来替代这个字符串。其使用的格式为/pattern/,使用的匹配操作符为: =(匹配),!(不匹配)。Perl语言中因为有这个功能,所以对于字符串的处理能力是非常强有力的。一:常用正则表达式简介:1匹配模式和匹配操作符:正如上面所说,匹配模式为/patter/,匹配操作符: =(匹配),!(不匹配)。 例如: if($line = /round-trip/) 2. 模式中

2、的特殊字符:,* ,?, ,, m等字符的含义如下:/pattern/ 含义:x? 找寻0个或是1个x字符x* 找寻0个或是0个以上的x字符x+ 找寻0个或是1个以上的x字符m 找寻刚好是m个个数指定的字符m,n 找寻在m个数个数以上,n个个数以下指定的字符 找寻符合内的字符 找寻不符合内的字符 0-9 找寻符合0到9的任何一个字符 a-z找寻符合a到z的任何一个字符 0-9 找寻不符合0到9的任何一个字符 a-z 找寻不符合a到z的任何一个字符x 找寻字符x开头的字符$x 找寻字符x结尾的字符a|b|c 找到符合a字符或是b字符或是c字符的字符串abc 找到一个含有abc的字符串d 找寻一个

3、digit(数字)的字符,和0-9语法一样D 找寻一个non-digit(非数字)的字符,和0-9语法一样w 找寻一个英文字母或是数字的字符,和a-zA-Z0-9语法一样 W 找寻一个非英文字母,数字的字符,和a-zA-Z0-9语法一样s 找寻一个空白的字符S 找寻一个非空白的字符 特别的是字符.,它可以匹配除换行外的所有字符,通常与*合用。“.*”表示除换行外得任意个任意字符下面是一些正则表达式在实际中用到或常用的范例:范例: 说明:/pe*rl/ 找到p后面跟着0个或多个e,再跟着rl的字符串,如同/cg0,1i/pe+rl/ 找到p后面跟着一个以上e,再跟着rl的字符串,如同/cg1,i

4、/pe?rl/ 找到p后面跟着0个或是一个e,再跟着rl的字符串,如同/cg0,1i/p.rl/ 找到p后面跟着一个任意字符,再跟着rl的字符串/p.*rl/ 找到p后面跟着任意个任意字符,再跟着rl的字符串/p|r|l/ 找到含有p或r或l的字符串/pe2,4rl/ 找到p后面跟着2个到4个e,再跟着rl的字符串 /perl/ 找到符合有这四个字符任意一个的字符串/perl/ 找到没有这四个字符中任意一个的字符串/round-trip/找到含有round-trip的字符串/round-trip/ 找到开头是round-trip的字符串/round-trip$/ 找到结尾是round-trip

5、的字符串/*/ 找到以*开头的字符串/ up| down/ 找到以空格up或空格down开头的字符串/CPU utilization for five seconds.*/ 找到含有 CPU utilization for five seconds加除换行符外的任意字符的字符串/round-trip min/avg/max/ 找到含有“round-trip min/avg/max”的字符串/-.*-/ 找到符合含有在以“-”开头,且在“-间-有除换行符外任何字符的字符串/d% packet loss/ 找寻符合含有数字 packet loss的字符串/ +d+/ 找到以一个或多个空格开头并且后

6、接一个或多个数字的字符串/pamvr.*/ 找到以pamvr开头且后接除换行符外任意字符的字符串/up.*up/ 找到含有两个up且在它们间有除换行符外任意字符的字符串/-rw-rw-r-/ 找到以-rw-rw-r-开头的字符串/d$/ 找到以数字结尾的字符串/up$/i 找到以up结尾,并且忽略up大小写的字符串/d/ 找寻符合数字的字符串,可以使用/d+/来表示一个或是多个数值的字符串/D/ 找寻符合不是数字的字符串/w/ 找寻符合英文字母,数字的字符串/W/ 找寻符合非英文字母,数字字符的字符 if ($line = /d+(.d+)?$/) 匹配非负浮点数例1:检验变量名的类型: if

7、 ($varname = /$A-Za-z_0-9a-zA-Z*$/) #以字符$开头的变量 print ($varname is a legal scalar variablen);#则为简单变量 elsif ($varname = /A-Za-z_0-9a-zA-Z*$/) #以字符开头的变量 print ($varname is a legal array variablen);#则为数组类型变量 elsif ($varname = /%A-Za-z_0-9a-zA-Z*$/) #以字符%开头的变量 print ($varname is a legal hash variablen);#

8、则为哈西表类型变量 else print (I dont understand what $varname is.n);# 3. 转义字符:如果你想在模式中包含通常被看作特殊意义的字符,须在其前加斜线。 如:/*+/中*即表示字符*,而不是上面提到的一个或多个字符的含义。4. 模式匹配选项:a、匹配所有可能的模式(g选项),不加g只匹配一处。 matches = balata = /.a/g; # now matches = (ba, la, ta)b、忽略大小写(i选项)例 /de/i 匹配de,dE,De和DE。c、将字符串看作多行(m选项) 在此情况下,符号匹配字符串的起始或新的一行的起

9、始;$符号匹配任意行的末尾。d、将字符串看作单行例 如/a.*bc/s匹配字符串axxxxxnxxxxbc,但/a.*bc/则不匹配该字符串。e、在模式中忽略空格 /d2 (W) d2 1 d2/x等价于/d2(W)d21d2/。5、替换操作符: 语法为s/pattern/replacement/,其效果为将字符串中与pattern匹配的部分换成replacement。如: $string = abc123def; $string = s/123/456/; # now $string = abc456def;但在替换部分不支持模式的特殊字符,如,*,+等,如s/abc/def/将把abc替换

10、为def。6、 翻译操作符: 这是另一种替换方式,语法如:tr/string1/string2/。同样,string2为替换部分,但其效果是把string1中的第一个字符替换为string2中的第一个字符,把string1中的第二个字符替换为string2中的第二个字符,依此类推。如: $string = abcdefghicba; $string = tr/abc/def/; # now string = defdefghifed 当string1比string2长时,其多余字符替换为string2的最后一个字符;当string1中同一个字符出现多次时,将使用第一个替换字符。二:其它正则表达

11、式功能简介:这里要介绍的是其它一些较少用到的正则表达式功能,作为上面功能的补充。1、模式的部分重用 当模式中匹配相同的部分出现多次时,可用括号括起来,用n(1,2)来多次引用,以简化表达式:例如:/d2(W)d21d2/ 匹配: 12-05-92 26.11.87 07 04 92等但不匹配12-05.92 注意:/d2(W)d21d2/ 不同于/(d2)(W)121/ ,后者只匹配形如17-17-17的字符串,而不匹配17-05-91等。2、指定模式定界符 缺省的,模式定界符为反斜线/,但其可用字母m自行指定,如: m!/u/jqpublic/perl/prog1! 等价于/u/jqpubl

12、ic/perl/prog1/ 注:当用字母作为定界符时,不做变量替换;当用特殊字符作为定界符时,其转义功能或特殊功能即不能使用。成对的符号必须成对地使用。3、模式次序变量 在模式匹配后调用重用部分的结果可用变量$n,全部的结果用变量$&。匹配处之前的部分用变量$,匹配处之前的部分用变量$。也可用列表一次取得。 $string = This string contains the number 25.11.; $string = /-?(d+).?(d+)/; # 匹配结果为25.11 $integerpart = $1; # now $integerpart = 25 $decimalpart

13、 = $2; # now $decimalpart = 11 $totalpart = $&; # now totalpart = 25.114扩展模式匹配 PERL支持PERL4和标准UNIX模式匹配操作所没有的一些模式匹配能力。其语法为:(?pattern),其中c是一个字符,pattern是起作用的模式或子模式。a、不存贮括号内的匹配内容 在PERL的模式中,括号内的子模式将存贮在内存中,此功能即取消存贮该括号内的匹配内容,如/(?:a|b|c)(d|e)f1/中的1表示已匹配的d或e,而不是a或b或c。b、内嵌模式选项 通常模式选项置于其后,有四个选项:i、m、s、x可以内嵌使用,语法为:/(?option

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 大杂烩/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号