一招吃透javascript正则表达式

大家好，欢迎来到IT知识分享网。

本篇文章给大家详细介绍一下吃通javascript正则表达式的方法。有一定的参考价值，有需要的朋友可以参考一下，希望对大家有所帮助。

正则表达式的作用

简单来讲正则表达式的作用就是进行字符串的增删改查，虽然javascritpt语言已经有及其完善的操作字符串的api，但是正则表达式会让你操作字符串更简单方便

创建正则表达式的方式

字面量形式

需要注意的是字面量形式的正则表达式是没有办法操作变量的，如下

const reg = "sattre is smart" let x = 's' console.log(/x/.test(reg)); //false

除非改成这样

// eval是把字符串变成js表达式 console.log(eval(`/${x}/`).test(str));

使用对象的形式创建正则表达式

使用对象的形式创建的好处就是能够直接接受正则变量

const x = 'a' let regs = new RegExp(x)  let str = 'All we need is love' let reg = new RegExp('A', 'g') // 第二个参数代表匹配的模式 console.log(reg.test(str));

小案例-实现输入字符高亮

其实就是和浏览器的ctrl+f功能差不多

<!DOCTYPE html>
<html lang="en">
  <head>
      
    <meta charset="UTF-8" />
      
    <meta http-equiv="X-UA-Compatible" content="IE=edge" />
      
    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
      
    <title>Document</title>
  </head>
  <body>
      
    <p id="main">    All we need is love  </p>
  </body>
  <script>
    const cin = prompt("输入想要高亮内容");
    const reg = new RegExp(cin, "g");
    let mainp = document.querySelector("#main");
    console.log(mainp);
    mainp.innerHTML = mainp.innerHTML.replace(reg, (matched) => {
      return `<span style="color:red">${matched}</span>`;
    });
  </script>
</html>

选择符

‘ | ’ 此为选择符，选择符两边的字符都可以匹配，都有效

let str1 = 'a' let str2 = 'b' console.log(/a|b/.test(str1)); //true console.log(/a|b/.test(str2)); //true

对转义的理解

自己的话理解就是，有些特殊符号如：{} [] . 等本来在正则表达式中就已经赋予了它的含义，如果单独使用会按照本身赋予的含义编译，如果需要匹配这些特殊符号本身，那么需要在这些符号前面加上一个 ‘’ 来加以区别

小数点本身的正则含义是除换行符外的任何字符

// 匹配小数点 \. let price = 23.34 console.log(/\d+\.\d+/.test(23.34)); //true

但是需要注意的来了

如果你是用对象方法声明的正则表达式的话，你需要在转义字符前多使用一次 ’ / ’ ,因为对象声明正则表达式传入的是字符串，他的解析方式不同

如下

let reg = new RegExp('\d+\.\d+') console.log(reg.test(price)); //false

console.log('/\d+\.\d+/');

需要改成：

let reg1 = new RegExp('\\d+\\.\\d+') console.log(reg1.test(price)); //true

再来一个

const url = 'https://space.bilibili.com//'  console.log(/https?:\/\/\w+\.\w+\.\w+\/\d+\//.test(url)); //true

字符边界约束

^ : 限定以其后面的第一个字符为开始
$: 限定以其前面的第一个字符为结束

写一个监测必须以数字开头结束的字符串

let str = '2dasdjifeiorepo' let str2 = '3dsf5' console.log(/^\d\w+\d$/.test(str)); console.log(/^\d\w+\d$/.test(str2));

注意：^ 如果用在[ ] 中还有除了[ ] 中的字符以外都可以匹配的意思

let str = `张三:3,李四:61` console.log(str.match(/[^\d,:]+/g));

注意：这里如果没有 ^ $ 的话任意的超过6个的字符串都会成功，因为没有开始和结束的限定，match会在字符串中任意取6个字符，所以也算作是成功的

<!DOCTYPE html>
<html lang="en">
  <head>
    <meta charset="UTF-8" />
    <meta http-equiv="X-UA-Compatible" content="IE=edge" />
    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
    <title>Document</title>
  </head>
  <body>
      <input type="text" name="user" />   <span></span>   
    <script>
      let input = document.querySelector("[name='user']");
      let span = document.querySelector("span");
      console.log(input);
      input.addEventListener("keyup", function () {
        // console.log(this.value.match(/^\w{3,6}$/));
        if (this.value.match(/^\w{3,6}$/)) {
          span.innerHTML = "正确格式";
        } else {
          span.innerHTML = "请输入3-6位字符";
        }
      });
    </script>
  </body>
</html>

元字符

元字符	匹配
\d	匹配数字
\D	匹配除了数字的其他字符
\s	匹配空白（换行符也算）
\S	除了空白的其他字符
\w	匹配字母数字下划线
\W	除了字母数字下划线
.	匹配除了换行符的任意字符

匹配一个邮箱

let str = `#$%@.com` let str2 = `@.com` console.log(str.match(/^\w+@\w+\.\w+$/)); console.log(str2.match(/^\w+@\w+\.\w+$/));

用 [ ] 巧妙匹配所有字符

如下，如果不加[ ] 代表完整匹配abc ，加了 [ ] ，代表可以匹配abc中的任意一个字符

let str = 'aaaabsdsc' console.log(str.match(/[abc]/g)); console.log(str.match(/abc/g));

可以用 [\s\S] [\d\D] 匹配所有字符

let str = '$%^&*()(*&^&*(sfhsdjf   asdoia ..fdsdgf nsefxg\][iogjpsf' console.log(str.length); console.log(str.match(/[\s\S]/g));

模式符

i : 不区分大小写
g: 全局匹配

let str = 'Www' console.log(str.match(/w/gi)); //["W", "w", "w"]

多行匹配

// 多行匹配  let str = `  #1 js,200元 #     #2 vue,500元 #     #3 angular,199元 # song    #4 node.js,188元 #    `let res = str.match(/\s*#\d+\s+.+\s+#\s+$/gm).map(item => {   item = item.replace(/\s*#\d+\s*/, '').replace(/#/, '')   let [name, price] = item.split(",")   return { name, price }})console.log(res);

字符属性

\p 后面加上{x} x代表要匹配的字符属性具体意思如下

元字符含义

\p{L} 所有字母
\p{N} 所有数字，类似于 \d
[\p{N}\p{L}] 所有数字和所有字母，类似于 \w
\P{L} 不是字母，等价于 [^\p{L}]
\P{N} 不是数字，等价于 [^\p{N}]

let str = "sadhusafsafha.啥事爱上撒大声地?!"// 匹配字符 console.log(str.match(/\p{L}/gu));// 匹配标点符号 console.log(str.match(/\p{P}/gu));// 匹配汉字 console.log(str.match(/\p{sc=Han}/gu));

模式符 u
此修饰符标识能够正确处理大于\uFFFF的Unicode字符。
也就是说，会正确处理四个字节的UTF-16编码。
此修饰符是ES2015新增，更多正则表达式新特性可以参阅ES2015 正则表达式新增特性一章节。

比如有些时候，一些宽字节的字符匹配不到，就需要用到模式符/u

lastIndex属性

let str = 'nihaowoshizhongguoren' let reg = /\w/g console.log(reg.lastIndex); console.log(reg.exec(str)); console.log(reg.lastIndex); console.log(reg.exec(str)); while ((res = reg.exec(str))) {   console.log(res);}

有效率的y模式

和g的区别就是，g模式只要还有满足条件的字符就会继续下去匹配，而y模式只要下一个字符不满足匹配条件，就会停止匹配。它的作用是让匹配更具有效率，一旦遇到条件不符合的就不会再检测后面的字符了

let str = '尼采的电话是:,, 没重要的事千万不要打给他，因为他已经疯了' let reg = /(\d+),?/yreg.lastIndex = 7 console.log(reg.exec(str)); console.log(reg.exec(str)); console.log(reg.exec(str)); console.log(reg.exec(str));

原子表和原子组的基本使用

[] 代表原子表:可选择匹配 ()代表原子组

let str = 'paul_sattre' console.log(str.match(/st/g)); //需要st一起才能匹配 console.log(str.match(/[st]/g)); //需要只要有s 或者 t 就可以匹配

let date1 = '2021/4/9' let date2 = '2021-4-9' console.log(date1.match(/\d+[-\/]\d+[-\/]\d+/)); console.log(date2.match(/\d+[-\/]\d+[-\/]\d+/));

其实上面还是有点缺陷
就是将date改成这样的时候 2021-4/9 前后两个符号不一致的时候还是能够匹配到，这个时候就可以用到原子组了

let date1 = '2021/4/9' let date2 = '2021-4-9' let date3 = '2021-4/9' console.log(date1.match(/\d+([-\/])\d+\1\d+/)); console.log(date2.match(/\d+([-\/])\d+\1\d+/)); console.log(date3.match(/\d+([-\/])\d+\1\d+/));

加了一个 () 后面的\1代表要和前面的()相同才能行

邮箱验证

// 邮箱验证 let str = '@.com.cn' let reg = /^[\w]+@[\w]+(\.[\w]+)+///["@.com.cn", ".cn", index: 0, input: "@.com.cn", groups: undefined] console.log(str.match(reg));// (\.[\w]+)+  表示括号之内的内容有1个或多个

原子组的替换操作

替换h标签为p标签

let str = `   <h1>hello</h1>   <h2>asdas</h2>   <h3>dasdad</h3> `let reg = /<(h[1-6])>([\s\S]+)<\/\1>/gi// console.log(str.replace(reg, '<p>$2</p>')); /  *      <p>hello</p>   <p>asdas</p>   <p>dasdad</p>  */let res = str.replace(reg, ($0, $1, $2) => {   return `<p>${$2}</p>`})/  * 上面回调函数中的 $0 代表的是整个匹配到的内容，之后的$1 $2 就是从左  * 到右的原子组匹配到的内容  */console.log(res);

不记录分组

https? 代表前面的字符s可以有也可以没有代表不记录到我们的
下面的(?:\w+.) 原子组中的 ?: 代表不记录到我们的组编号之中

let str = `   https://www.nihao.com   http://nihao.com `; let reg = /https?:\/\/((?:\w+\.)?\w+\.(?:com|cn|net))/gi; let urls = []; while ((res = reg.exec(str))) { urls.push(res[1]); } console.log(urls);

所以有没有www都能匹配到

多种重复匹配基本使用

+ ：一个或多个
* ：零个或多个
{a,b}： a-b范围内的出现次数
?：零个或1个

// 多种重复匹配基本使用 let str = 'asddddddddd' let str2 = 'as' console.log(str.match(/sd+/)); //1个或多个 console.log(str2.match(/sd*/)); //0个或多个 console.log(str.match(/sd{2,3}/)); // 2或3个 console.log(str.match(/sd?/)); // 0个或1个

// 重复匹配对原子组的影响 let str = 'asdddddsd' console.log(str.match(/(sd)+/g));  //["sd", "sd"]

限定用户名为3-8位并且是以字母开头

// 限定用户名为3-8位并且是以字母开头 let username = 'a_Coding' let username1 = '2fdsdfd' let username2 = 's' let username3 = 'asdsadsadsad'; console.log(/^[a-z]\w{2,7}$/i.test(username)); console.log(/^[a-z]\w{2,7}$/i.test(username1)); console.log(/^[a-z]\w{2,7}$/i.test(username2)); console.log(/^[a-z]\w{2,7}$/i.test(username3));

禁止贪婪

使用正则/sd+/ 匹配上面字符串时+会默认贪婪多个d，+后面加个？就只会匹配一个d了这就是禁止贪婪

// 禁止贪婪 let str = 'asdddddd' /  * 使用正则/sd+/ 匹配上面字符串时+会默认贪婪多个d  * +后面加个？就只会匹配一个d了  这就是禁止贪婪  */console.log(str.match(/sd+/)); //sdddddd  console.log(str.match(/sd+?/)); //sd  console.log(str.match(/sd*/)); //sdddddd  console.log(str.match(/sd*?/)); //sd  console.log(str.match(/sd{1,4}/));//sdddd  console.log(str.match(/sd{1,4}?/));//sd

断言匹配

?= 后边是什么的

应该注意的是：断言只是对前面匹配的条件限定，并不参与实际的匹配结果中。
?= 中的等于号后面如果是个a，那么前面的匹配字符需要后面是a才会被匹配

// 断言匹配  ?=  后边是什么的 let str = '我爱你，你爱他' let reg = /爱(?=你)/  //匹配后面有一个,号的love console.log(str.replace(reg, '不爱'));  //我不爱你，你爱他

使用断言规范价格

 let lessons = `   js,343元,400次   node.js,300.00元,134次   java,500元,432次 ` let reg = /(\d+)(.00)?(?=元)/gi lessons = lessons.replace(reg, (v, ...args) => {   console.log(args);   args[1] = args[1] || '.00'   return args.slice(0, 2).join('')}) console.log(lessons);

?<= 前面是什么的

理解上面的第一个断言这个也就能猜到意思了

//  ?<=  前面是什么的 let str = '我爱你，你爱他' let reg1 = /(?<=你)爱/ console.log(str.replace(reg1, '不爱'));// 我爱你，你不爱他

使用断言模糊电话号码

let users = `   乔丹电话:,   艾弗森电话;0 `; // 给电话号码的后4位变成* let reg = /(?<=\d{7})\d+/g; // console.log(users.match(reg)); users = users.replace(reg, "*".repeat(4)); console.log(users);

?! 后面不是什么的就匹配

let str = 'hfewhieuwhfefhiuewfhiew' let reg = /[a-z]+(?!\d+)$/i  //取后面不是数字的字母 注意这里的这个$非常重要 console.log(str.match(reg)); //efhiuewfhiew

?<! 前面不是什么的就匹配

let str = 'asdae334dsfdsff' let reg = /(?<!\d+)[a-z]+/i console.log(str.match(reg));  //asdae

字符串正则方法

search : 返回索引值，找不到就是-1
match: 返回匹配后的字符结果数组
matchAll 返回全局匹配的迭代对象
split 分割字符串形成数组

/// 字符串正则方法 let str = "i love you"; console.log(str.search("u")); // 返回索引值，找不到就是-1 console.log(str.search(/o/)); // 返回匹配后的字符结果  数组 console.log(str.match(/o/)); //["o", index: 3, input: "i love you", groups: undefined] // matchAll split let date = "2001-1/1"; console.log(date.split(/[-\/]/)); //["2001", "1", "1"]

matchAll

<body> <h1>all we need is love</h1> <h2>all we need is love</h2> <h3>all we need is love</h3> <script> let reg = /<(h[1-6])>([\s\S]+?)<\/\1>/gi; const content = document.body.innerHTML.matchAll(reg); // console.log(content); let res = []; for (const it of content) { // console.log(it); res.push(it[2]); } console.log(res); let str = "woainiw"; // 为低端浏览器自定义原型方法matchALl String.prototype.matchAll = function (reg) { let res = this.match(reg); if (res) { let str = this.replace(res[0], "^".repeat(res[0].length)); let match = str.matchAll(reg) || []; return [res, ...match]; } }; console.log(str.matchAll(/(w)/i)); </script> </body>

$符号在正则替换中的使用

$& 代表匹配到的内容
$` 代表匹配到的前面内容
$’ 代表匹配到的后面内容

let date = '2013/5/6'

let str = '(010)  (020)' let reg = /\((\d{3,4})\)(\d{7,8})/g console.log(str.replace(reg, "$1-$2")); // 010-  020- // $&  代表匹配到的内容   // $`  代表匹配到的前面内容 // $'  代表匹配到的后面内容 let str = '我爱你' console.log(str.replace(/爱/, '不$&')); //我不爱你 console.log(str.replace(/爱/, "$`")); //我我你 console.log(str.replace(/爱/, "$'")); //我你你

【推荐学习：javascript高级教程】

免责声明：本站所有文章内容,图片，视频等均是来源于用户投稿和互联网及文摘转载整编而成，不代表本站观点，不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益，请在线联系站长,一经查实,本站将立刻删除。本文来自网络,若有侵权，请联系删除，如若转载，请注明出处：https://haidsoft.com/149030.html