$ASCII$编码采用$1 Byte$,最多$256$个字符
扩展编码(加字节)
- $ISO8859(1-15)$:西欧语言
- $GB2132,GBK,GB18030$:$ASCII+$中文$(GB18030>GBK>GB2312)$
- $Big5$:$ASCII+$繁体中文
- $Shift\_JIS$:$ASCII+$日文
- $Unicode$(字符集)
- 目标
- 不断扩充,存储全世界所有的字符
- 编码方案
- $UTF-8$,兼容$ASCII$,变长($1-4$个字节存储字符),经济,方便传输
- $UTF-16$,变长($2-4$个字节)来存储所有字符
- $UTF-32$,用$4$个字节存储所有字符
- 目标
$ANSI$编码
- $Windows$上非$Unicode$的默认编码
- 在简体中文$Windows$操作系统中,$ANSI$编码代表$GBK$编码
- 在繁体中文$Windows$操作系统中,$ANSI$编码代表$Big5$编码
- $ANSI$编码文件不能兼容使用
$Java$的字符编码
- 源文件编码:采用$UTF-8$编码
- 程序内部采用$UTF-16$编码
- 和外界(文本文件)的输入输出尽量采用$UTF-8$编码