文章教程

15.4PHP中的PERL兼容正则表达式函数

9/17/2020 9:26:54 PM 人评论 次浏览

15.4 PHP中的PERL兼容正则表达式函数

对PERL语言有所了解的读者,一定对PERL中正则表达式的强大功能印象深刻。PERL最初就是设计为用来处理文本文件的一种语言,至今,PERL语言在处理文本方面的强大功能仍是无可比拟,尤其在维护、分析系统数据方面,PREL语言扮演着不可替代的角色。

正是基于此,PHP中除了可以使用POSIX函数支持正则表达式之外,还可以使用PERL兼容的正则表达式函数。从PHP4.0开始,包含了一个PERL兼容的正则表达式(PCRE)库,和正常regex库一起与PHP绑定。另外,PCRE和PERL的正则表达式之间有一些细微差别,但这并不在本书讨论范围之内。本节就为读者介绍如何使用PERL兼容的正则表达式函数。

15.4.1 PERL兼容正则表达式中的修正符

在正式介绍PERL兼容正则表达式函数之前,先来了解一下PERL兼容正则表达式中可能使用的修正符。所谓修正符,是指在正则表达式最后诸如/si之类的修正说明。这些修正符如下所示,括号中的名称是这些修正符的内部PCRE名,对于这个名称,读者可以不必过于关注。

❑i(PCRE_CASELESS):匹配时忽略大小写。

❑m(PCRE_MULTILINE):当设定了此修正符,行起始(^)和行结束($)除了匹配整个字符串开头和结束外,还分别匹配其中的换行符(\n)的之后和之前。

❑s(PCRE_DOTALL):如果设定了此修正符,模式中的圆点元字符(.)匹配所有的字符,包括换行符。如没有此设定的话,则不包括换行符。

❑x(PCRE_EXTENDED):如果设定了此修正符,模式中的空白字符除了被转义的或在字符类中的以外完全被忽略。

❑e:如果设定了此修正符,preg_replace()在替换字符串中对逆向引用作正常的替换,将其作为PHP代码求值,并用其结果来替换所搜索的字符串。只有preg_replace()使用此修正符,其他PCRE函数将忽略之。

❑A(PCRE_ANCHORED):如果设定了此修正符,模式被强制为“anchored”,即强制仅从目标字符串的开头开始匹配。

❑D(PCRE_DOLLAR_ENDONLY):如果设定了此修正符,模式中的行结束($)仅匹配目标字符串的结尾。没有此选项时,如果最后一个字符是换行符,也会被匹配。如果设定了m修正符则忽略此选项。

❑S:当一个模式将被使用若干次时,为加速匹配而值得先对其进行分析。如果设定了此修正符则会进行额外的分析。目前,分析一个模式仅对没有单一固定起始字符的non-anchored模式有用。

❑U(PCRE_UNGREEDY):使“?”的默认匹配成为贪婪状态。

❑X(PCRE_EXTRA):模式中的任何反斜线后面跟上一个没有特殊意义的字母导致一个错误,从而保留此组合以备将来扩充。默认情况下,一个反斜线后面跟一个没有特殊意义的字母被当成该字母本身。

❑u(PCRE_UTF8):此修正符启用了一个PCRE中与PERL不兼容的额外功能。模式字符串被当成UTF-8。本修正符在UNIX下自PHP4.1.0起可用,在Win32下自PHP4.2.3起可用。自PHP 4.3.5起开始检查模式的UTF-8合法性。

教程类别