Unicode是一种通用的国际标准字符编码,能够表示世界上大多数的书面语言。
为什么java使用Unicode系统?
在Unicode之前,有很多语言标准:
- ASCII (美国信息交换标准代码)。
- ISO 8859-1 用于表示西欧语言。
- KOI-8 用于表示俄文。
- GB18030 和 BIG-5 用于表示中文等等。
问题
这导致两个问题:
- 指定代码值对应于各种语言标准中的不同字母。
- 具有大字符集的语言的编码具有可变长度。一些常见字符被编码为单字节,其他需要两个或多个字节。
解决办法
为了解决这些问题,开发了一种新的语言标准,即Unicode系统。在unicode中,每个字符保存为2
个字节,因此java也使用2
个字节的字符。
最小值: \u0000
最高值: \uFFFF