不一样的UniCode

不一样的UniCode不一样的 UniCode 什么是 UniCodeUniCo 其实是一种编码标准 也被称为万国码 单一码 是计算机科学领域里的一种业界标准 Unicode 是为了解决传统的字符编码方案的局限而产生的 它为每种语言中的每个字符设定了统一并且唯一的二进

大家好,欢迎来到IT知识分享网。

不一样的UniCode

什么是UniCode

UniCode其实是一种编码标准,也被称为万国码,单一码,是计算机科学领域里的一种业界标准,Unicode是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。

我们在跨平台开发时就可以采用UniCode统一解决编码问题,那么UniCode仅限于解决编码问题吗?当然绝对不是,UniCode还可以玩的花里胡哨。

不一样的UniCode

看下面一个案例,到底能输出什么值呢?

public class TestUniCode {     public static void main(String[] args) {         int a=1;         // \u000d \u0061\u002b\u002b\u003b         System.out.println(a);     } } 

这个明眼一看,这不是非常简单吗?JAVA并不会执行注释内容,所以打印出来的肯定是a=1啊,这个不可能有问题啊,但是结果真是这样吗?

结果展示

不一样的UniCode

显然是注释中的代码生效了,这样是不是有点怀疑人生了,明明JAVA代码可以采用双斜杠注释,为什么双斜杠会没有生效呢?

这就是UniCode的魅力了,编译过程中会将JAVA代码中的UniCode编码翻译为对应的字符。下面来验证一波

public class TestUniCode1 {     public static void main(String[] args) {         System.out.println("5 + 10 = \u0022+ (5+10) + \u0022");     } } 

按照语句这里都会被解释为字符串也就是原样输出,可结果是

不一样的UniCode

为什么呢?将上面的Java代码进行编译,查看编译后的class文件

// 编译后的class文件 public class TestUniCode1 {     public TestUniCode1() {     }     public static void main(String[] args) {         System.out.println("5 + 10 = 15");     } } 

JAVA将代码中的UniCode翻译为对应的字符串,将\u0022翻译为了双引号半边 “,相当于如下JAVA代码

System.out.println("5 + 10 = "+ (5+10) + ""); 

其实我们除了\u0022外,还有很多特殊字符,对照表如下所示

Unicode转义字符含义Unicode转义字符含义\u000a换行符 \n\u0022双引号半边 “\u000d回车符 \r\u002b加号 +\u007d大括号右半部 }\u003b分号 ;\u007b大括号左半部 {\u0061 — \u007a字符 a-z\u0041 — \u005a字符 A-Z

所以这也能解释上面的第一个问题了,为什么输出的a=2呢?

首先根据对照表我们可以知道\u000d为回车符\r,也就是说在双斜杠后面回车了,那么后面的UniCode是什么呢?这个可以借助网上的一些UniCode的在线翻译工具,可以参考https://c.runoob.com/front-end/3602/

不一样的UniCode

我们可以很清晰的看到后面的代码为a++;那么一切都清楚了,我们可以将a=2的代码等价翻译如下所示

public static void main(String[] args) {     int a=1;     //     a++;     System.out.println("==结果打印=="+a); } 

其它好玩的案例

除了上面提到的一个案例外,还有几个给大家参考

案例一

public static void main(String[] args) {     if(false == true){         // \u000a     \u007d        \u007b         //  换行符  大括号右半部 }    大括号左半部 {         System.out.println("false为真了!!!");     } } ================================== // 输出结果:false为真 // 代码型如  System.out.println("false为真了!!!"); 

案例二

字符混淆

public static void main(String[] args) {     // \u0022为双引号半边"     System.out.println("a\u0022.length()+\u0022b".length()); } ================================== // 输出结果:2 // 代码型如:System.out.println("a".length() + "b".length()); 

总结

UniCode在开发中可以统一编码,但我们操作的时候一定需要注意特殊字符的转换,一旦不小心在注释中加了特殊UniCode字符,就有可能导致业务错乱,这样就相当于在代码里面下毒了,相当于给自己埋坑。

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://haidsoft.com/186242.html

(0)
上一篇 2025-08-21 10:45
下一篇 2025-08-21 11:10

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信