您所在的位置：程序员俱乐部 > 编程开发 > .NET > 正则匹配模式汇总

正则匹配模式汇总

2017/8/20 16:08:39 OkayChen 程序员俱乐部我要评论(0)

摘要：正则表达式提供另一种强大的文本搜索和处理方式，对于正则表达式，不同语言有着不同的实现，JavaScript采用的Perl5的语法。对于极少数匹配模式是简单的全字符文本的情况，我们往往会采用indexOf这样的方法，但是多数情况下，匹配模式往往都更为复杂。1、语法1）在JavaScript中我们可以采用内建构造器RegExp()来创建正则表达式的对象；varre=newRegExp("j.*t")2）当然除了使用RegExp对象，我们可以采用更为简便的正则文本标记法varre=/j.*t/2
标签：模式正则

　正则表达式提供另一种强大的文本搜索和处理方式，对于正则表达式，不同语言有着不同的实现，JavaScript采用的Perl5的语法。对于极少数匹配模式是简单的全字符文本的情况，我们往往会采用indexOf这样的方法，但是多数情况下，匹配模式往往都更为复杂。

1、语法

　　1）在JavaScript中我们可以采用内建构造器RegExp()来创建正则表达式的对象；

　　　　 var re = new RegExp("j.*t")

　　2）当然除了使用RegExp对象，我们可以采用更为简便的正则文本标记法

　　　　 var re = /j.*t/

2、RegExp对象属性

　　1、global：是否打开全局搜索（默认是false，只匹配到第一个）

　　2、ignoreCase：设置大小写相关性

　　3、multiline：设置是否跨行搜索

　　4、lastIndex：搜索的开始索引位置，默认为0

　　5、source：用于存储正则表达式的匹配模式

除了laseIndex外，上面所有属性在设置之后都不再被修改，也就是说：

　　var re = /j.*t/ig; 　　

　　re.global // true; 　　

　　re.global = false; 　　

　　re.global // true;

3、RegExp对象的方法

　　RegExp对象中有两种方法可用于查找匹配内容的方法：test（）和exec（）。这两种方法的参数都是一个字符串，test（）方法返回的是一个布尔值、而exec（）返回的由匹配到字符串所组成的数组。

/j.*t/.test("JavaScript");         //false
/j.*t/i.test("JavaScript");        //true
/j.*t/i.exec("JavaScript")[0];   //"JavaScript"

　　以正则表达式为参数的字符串的方法

　　1）match() 返回一个包含匹配内容的数组

　　2）search() 返回的是第一个匹配内容的所在位置

　　3）replace() 能将匹配的文本替换程指定字符串

　　4）split() 根据正则分割若干个数组元素

　match()方法

　　var s = new String('HelloJavaScriptWorld'); 　　

　　s.match(/a/) //["a"] 　　

　　s.match(/a/g) // ["a","a"]　　

　　s.match(/j.*a/i) // ["Java"]

　　search()方法

　　 search方法会返回匹配字符串的索引位置（从0开始）

　　 s.search(/j.*a/i); //5

　　replace()方法

　　 replace用于将匹配的文本替换掉

　　 s.replace(/[A-Z]/g,'_$&'); //_Hello_JavaScript_World

　　　　 ①$&保留原来匹配对象并在前面加_

　　　　 ②&1表示匹配的第一组以此类推

　　split()方法

　　 var csv = "one,two,three,four";

　　csv.spilt(/\s*,\s*/); //["one","two","three","four"]

　　　　　①\s*用于匹配0个或者多个空格

4、回调式替换

　　当我们需要执行一些特定的替换操作时，也可以通过返回字符串的函数来完成。

　　var global；

　　var callback = function () {

　　　　global = argumens;

　　　　return argumens[1] + 'a' + argumens[2] + 'dot' + arguments[3];

　　}

　　var re = /(.*)@(.*)\.(.*)/;

　　"OkayChen@cnblogs.com".replace(re,callback); //OkayChen at cnblogs dot com

5、正则匹配模式　

匹配模式相关说明 [abc]

　　匹配的字符类信息

　　　　> "Some Text".match(/[otx]/g); //['o','t','x','t'];

[a-z]

　　[a-z]就相当于[abcd],[a-z]就表示我们要匹配所有的小写字母，而[a-zA-Z0-9_]就是匹配所有的

字母、数字及下划线

　　　　> "Some Text".match(/[a-z]/g); //['o','m','e','e','x','t'];

[^abc]

　　匹配所有不属于限定范围内的字符

　　　　> "Some Text".match(/[^a-z]/g);　　//['S','','T'];

a|b

　　这里匹配的是a或者b

　　　　> "Some Text".match(/t|T/g);　　 //['T','t'];

a(?=b)

　　匹配所有后面跟着b的a的信息

　　　　> "Some Text".match(/Some(?= Tex)/g);　 //["some"]

　　　　> "Some Text".match(/Some(?=Tex)/g);　 //null

a(?！b)

　　匹配所有后面不跟着b的a的信息

　　　　> "Some Text".match(/Some(?!Tex)/g);　 //["some"]

　　　 > "Some Text".match(/Some(?! Tex)/g);　 //null

　　反斜杠主要用于帮助我们匹配一些模式文本中的特殊字符

　　　　> "R2-D2".match(/[2\-3]/g);　 //["2","-","2"]

　　换行符

　　回车符

　　换页符

　　横向制表符

　　纵向制表符

　　　这是匹配的空白符，包含上面五个转义字符　　

　　　　> "R2\n D2".match(/\s/g);　 //["n",""]

\S 　　　匹配除空白符以外的内容，就相当于 [^\s] \w 　　　匹配所有的字母、数字和下划线，相当于 [A-Za-z0-9_] \W 　　　刚好与\w相反 \d 　　　匹配所有的数字类信息相当于 [0-9]
\D 　　刚好与\d相反 \b 　　　匹配一个单词的边界，例如空格和标点符号 \B 　　　刚好与\b相反 [\b] 　　　匹配的是退格键符（Backspace） \0 　　　这里匹配的是null　　　　　 \uoooo

　　这里匹配的是一个unicode字符，并且是一个四位16进制数来表示，

　　　　> "CTOH".match(/\u0441\u0442\u943E/)　　//["CTO"] 　　　

\x00

　　　这里匹配的是一个字符，该字符的编码是一个两位十六进制数来表示的

　　　　> "dude".match(/x64/g);　　// ["d","d"]　

^ 　　　匹配字符串的开头部分，如果设置了m，那就是匹配每一行的开头 $ 　　匹配字符串的结尾部分，如果设置了m，那就是匹配每一行的结尾 . 　　　这里匹配的是除了换行符以为的任何字符 * 　　　这里匹配的是模式中间出现0次或者多次的内容。例如/.*/可以匹配任何内容？

　　匹配模式中间出现0次或者1次的内容

　　　　　> "anything".match(/ng?/g); //["ng","n"]

　　这里匹配的是模式中间至少出现一次或者多次的内容

　　　　　>　"R2-D2" and C-3PO".match("/[a-z+/gi"); 　//["R","D","and","C","po"]

{n}

　　匹配模式中出现n次的内容