大家好,欢迎来到IT知识分享网。
字符串中的转义
一般,反斜杠(\)在字符串中有特殊的含义,用来和后面的字符一起组合表示一些特殊字符,所以又被称为转义符。
反斜杠后面可以跟着的字符大致有以下几种:
- 字母
- 三位八进制
- x 加上 两位十六进制
- Unicode码点
字母
转义字符中最基础的就是:使用反斜杠\加上字母,表示那些无法输入表示特殊含义的字符,常见的有以下几种:
- \b 后退键
- \f 换页符
- \n 换行符
- \r 回车键
- \t 制表符
- \v 垂直制表符
以前在字符串拼接时,就经常使用\n、\t:
"\n " + console.log('test') + "\n "
'\a' // 'a' '\"' // '"' '\?' // '?'
十六进制数字
十六进制更常用,它的转义规则:\x<hex>,\x后跟上2位十六进制数。
因为只有两位,范围是:0x00-0xFF,所以这种方式也只能输出265种字符,其中:
- 0x00-0x7F 和ASCII码一致
- 0x80-0x9F 表示控制字符
- 0xA0-0xFF 表示文字字符
'\xA9' // '©' '\x75' === 'u' // true '\x67' // 'g'
八进制数字
反斜杠后面跟3位八进制数(),就代表一个转义字符:
'\251' // '©' '\165' === 'u' // true '\106' // 'F'
取值范围:000-377,总共也是有256种字符,其中就包含了所有的ASCII码。
'\xA9' === '\251' // true '\200' === '\x80' // true
Unicode码点
'\u{A9}' // '©' '\u{597d}' // '好' '\u{1f604}' // '😄'
'\u00A9' // "©" '\u0075' === 'u' // true '\u597d' // '好'
对于非基本平面的字符,则要使用UTF-16的码元规则,一般是两个码元:\u<hex>\u<hex>,\u后各4位十六进制:
'\uD83D\uDE04' // '😄' '\uD83C\uDF34' // '🌴'
只要获取到字符的Unicode编号码点,即可以通过这种方式转义所有的字符。
正则表达式中的转义
在正则表达式中,需要反斜杠转义匹配的字符,一共是12个:^ . [ $ ( ) | * + ? { \,这些字符都是正则的特殊字符。
/5$/.test('5$') // false /5\$/.test('5$') // true
上面代码,$符号加了转义才能匹配成功,否则不匹配。
当使用RegExp方法时,正则参数是字符串,反斜杠\需要2个,因为字符串内会先转义一次:
(new RegExp('5$')).test('5$') // false (new RegExp('5\$')).test('5$') // false (new RegExp('5\\$')).test('5$') // true
上面代码中,只有第三行因为使用了两个反斜杠,才能转义成功,得到正确的值。
HTML中的转义
HTML中转义字符也是较常见的,主要有三种形式的转义。
最常见的是基于实体名称:
&后加上实体名称 再加上分号;:
空格 大于号 > >
实体名称转义以前是为了处理html中的特殊的字符显示问题,比如小于号 <在THML中是作为元素标签的一部分使用的,作为特殊字符,直接输入会出错。
但目前在现代浏览器上,已经能正常显示大于小于号这些符号,可以不使用转义字符。
另两种是基于Unicode码点:
&#x后加十六进制码点 再加上分号;:
😄 => 😄 好 => 好 & => &
&#后加十进制的码点 再加上分号;:
&#; => 😄 好 => 好 & => &
| 字符 | 名称 | 名称转义 | 码点转义 |
|---|---|---|---|
| “ | 双引号 | " | " |
| & | 和号 | & | & |
| < | 小于号 | < | < |
| > | 大于号 | > | > |
| ’ | 单引号 | ' | ' |
| 空格 | 空格 | |   |
| © | 版权号 | © | © |
| ¢ | 分 | ¢ | ¢ |
| £ | 镑 | £ | £ |
| ¥ | 人名币 | ¥ | ¥ |
| $ | 美元 | $ | $ |
| © | 版权 | © | © |
| ® | 注册商标 | ® | ® |
| × | 乘号 | × | × |
| ÷ | 除号 | ÷ | ÷ |
URL转义字符
可以使用encodeURIComponent 和 decodeURIComponent 对URL链接进行编解码处理。
URL中的转义规则:根据系统的默认编码(一般是UTF-8),是使用百分号(%)加上两位的十六进制数。
实际的转义,就是基于Unicode字符的码点,不过与字符串不太一样,这里使用的一般是UTF-8编码方式。
URL部分元字符的转义:
| 元字符 | 名称 | 转义符 |
|---|---|---|
| + | 加号 | %2B |
| 空格 | 空格 | %20 |
| / | 斜杠 | %2F |
| ? | 问号 | %3F |
| # | 井号 | %23 |
| & | 和号 | %26 |
| = | 等号 | %3D |
| : | 冒号 | %3A |
| @ | at符 | %40 |
| , | 逗号 | %2C |
| ; | 分号 | %3B |
中文等特殊字符则被转义成多个组合:
encodeURIComponent('http://baidu.com/中国😄') // 'http%3A%2F%2Fbaidu.com%2F%E4%B8%AD%E5%9B%BD%F0%9F%98%84'
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://haidsoft.com/118572.html