# 正则表达式

  • 用来匹配字符串的一种规则表达式

# 创建正则对象

  • 构造函数
    • var reg = new RegExp(正则表达式,匹配模式);
    new RegExp(pattern,attributes);
    参数:参数pattern是一个字符串,指定了正则表达式的模式;
    参数attributes是一个可选的参数,包含属性 g(globle全局匹配),i(忽略大小写),m(多行匹配)
  • 字面量
    • var reg = /正则规则/匹配模式;

# 调用匹配方法

  • test 最常用 某个正则对象用来匹配某个字符串
    • 如果匹配成功,得到 true,否则为 false
    • 正则对象.test(字符串)
    例:匹配字符串中出出现连续的三个小写a
    var reg = new RegExp(/a{3}/);
    console.log(reg.test("aaac")); //true
    console.log(reg.test("baaab"));//true
    console.log(reg.test("aa"));//false
    console.log(reg.test("AAA"));//false
  • match 匹配某个字符串用
    • 字符串.match(正则表达式)
    • 返回值:数组 -- 包含 匹配的字符串 匹配的索引 原来的字符串
    例:匹配字符串中是否包含连续的三个小写a
    console.log("aaabcdefaaaghjiy".match(/a{3}/));
  • exec
    • 匹配字符串用的
    • 正则对象.exec(字符串) 返回值跟 match 是一样的

# 正则表达式中的元字符

  • 元字符
    .      除了\r\n意外的任意单个字符
    \       转义字符  把原本有意义的字符转换成普通的字符
    |       或者,表示左右两边的字符或者表达式任意出现一个
    ()      分组  或者 提升优先级
  • 量词
    *     出现任意多次
    ?     0次或者1次
    +     至少1次

    {n}   表示前面的字符或者表达式出现n次
    {n,}  表示至少出现n次
    {n,m} 表示最少出现n次,最多出现m次
  • 范围
    开始    ^  表示以某个字符或者表达式开头(严格模式)
    结尾    $  表示必须以某个字符或者表达式结尾
   []  表示某个范围或者用来转义特殊字符   [*]
   [0-9]   表示数字
   [a-z]   表示小写字母
   [A-Z]   表示大写字母
   [0-9a-zA-Z] 表示数字和字母
   中括号表示的是某个集合,既可以是范围的集合,也可以是某些字符的集合
  • 预定义类
     ""  空字符串既不是空白也不是非空白

     \d	[0-9]	 数字字符
     \D	[^0-9]	非数字字符

     \s	[\f\r\n\t\v]	空白字符  >>  空格   \r  \n  \t
     \S	[^\f\r\n\t\v]	非空白字符

     \w	[a-zA-Z0-9_]	单词字符(所有的字母和数字)
     \W	[^a-zA-Z0-9_]	非单词字符
  • 一些验证
    文字验证:/^[\u4e00-\u9fa5]{2,6}$/;
    邮箱验证:/^[0-9a-zA-Z_.-]+[@][0-9a-zA-Z]+[.][0-9a-zA-Z.]+$/;
    身份证号码验证:/^[1-9](\d{14})|(\d{16}([0-9]|[xX]))$/;
    手机号码验证:/^[1]([3-9]\d{9}$/;
    qq号码验证:/^[1-9]\d{4,10}$/;
    电话号码验证:/^[0]\d{2,3}[-]\d{7,8}$/;

# 书写规则

  • \: 转义字符,普通字符前面加上\可以代表特殊意义的字符。特殊意义的字符,也可以将其转换为普通字符。 当使用 new RegExp("pattern")方法的时候不要忘记将\它自己进行转义,因为\在字符串里面也是一个转义字符。
  • ^: 匹配输入的开始。匹配行首的字符。
  • *: 匹配前一个字符 0 次或者是多次。
  • +: 匹配前面一个字符 1 次或者多次,和{1,}有相同的效果。
  • ?: 匹配前面一个字符 0 次或者 1 次,和{0,1}有相同的效果。
  • .: (小数点)匹配任何除了新一行开头字符的任何单个字符。
  • (x): 匹配‘x’并且记住匹配项。这个被叫做捕获括号。可以通过数组得到匹配的对象。
  • (?:x): 匹配'x'但是不记住匹配项。这种被叫做非捕获括号。
  • x(?=y): 匹配'x'仅仅当'x'后面跟着'y'.这种叫做正向肯定查找。
  • x(?!y): 匹配'x'仅仅当'x'后面不跟着'y',这个叫做正向否定查找。
  • x|y: 匹配‘x’或者‘y’。
  • {n}: n 是一个正整数,匹配了前面一个字符刚好发生了 n 次。
  • {n,m}: n 和 m 都是正整数。匹配前面的字符至少 n 次,最多 m 次。如果 n 或者 m 的值是 0, 这个值被忽略。
  • [xyz]: 一个字符集合。匹配方括号的中任意字符。你可以使用破折号(-)来指定一个字符范围。对于点(.)和星号(*)这样的特殊符号在一个字符集中没有特殊的意义。他们不必进行转意,不过转意也是起作用的。
  • [^xyz]: 一个反向字符集。也就是说, 它匹配任何没有包含在方括号中的字符。你可以使用破折号(-)来指定一个字符范围。任何普通字符在这里都是起作用的。
  • [\b]: 匹配一个退格(U+0008)。(不要和\b 混淆了。)
  • \b: 匹配一个词的边界。一个词的边界就是一个词不被另外一个词跟随的位置或者不是另一个词汇字符前边的位置。注意,一个匹配的词的边界并不包含在匹配的内容中。换句话说,一个匹配的词的边界的内容的长度是 0。(不要和[\b]混淆了)
  • \B: 匹配一个非单词边界。他匹配一个前后字符都是相同类型的位置:都是单词或者都不是单词。一个字符串的开始和结尾都被认为是非单词。
  • \cX: 当 X 是处于 A 到 Z 之间的字符的时候,匹配字符串中的一个控制符。
  • \d: 匹配一个数字。等价于[0-9]。
  • \D: 匹配一个非数字字符。等价于0-9 (opens new window)
  • \f: 匹配一个换页符 (U+000C)。
  • \n: 匹配一个换行符 (U+000A)。
  • \r: 匹配一个回车符 (U+000D)。
  • \s: 匹配一个空白字符,包括空格、制表符、换页符和换行符。
  • \S: 匹配一个非空白字符。
  • \t: 匹配一个水平制表符 (U+0009)。
  • \v: 匹配一个垂直制表符 (U+000B)。
  • \w: 匹配一个单字字符(字母、数字或者下划线)。等价于[A-Za-z0-9_]。
  • \W: 匹配一个非单字字符。等价于A-Za-z0-9_ (opens new window)
  • \n: 当 n 是一个正整数,一个返回引用到最后一个与有 n 插入的正值表达式(counting left parentheses)匹配的副字符串。
  • \0: 匹配 NULL (U+0000) 字符, 不要在这后面跟其它小数,因为 \0 是一个八进制转义序列。
  • \xhh: 匹配带有两位小数代码(hh)的字符。
  • \uhhhh: 匹配带有四位小数代码(hh)的字符。

# 截取/替换两个字符之间的字符串

const str = '/detail/page-1.html'
// 获取
str.match(/page-(\S*).html/)[1]
// 替换
str.replace(/(?<=page-).*?(?=.html)/, 2)