计算机只能识别二进制数据,早期就是电信号。
为了方便计算机可以识别各个国家的文字,就需要将各个国家的文字采用数字编号的方式进行描述并建立对应关系表,该表就叫
编码表
字符与数字建立关系的表,叫做编码表
ASCII:美国标准信息交换码,使用一个字节的低7位二位进制进行表示
ISO8859:拉丁码表,欧洲码表,使用一个字节的8位二进制表示
GBK:中国的中文编码表升级,融合了更多的中文文字符号,最多使用两个字节16位进制位表示
Unicode:国际标准码,融合了目前人类使用的所有字符,为每个字符分配唯一的字符码。所有的文字都用两个字节16位二进制来表示
Unicode只是定义了一个庞大的,全球通用的字符集,并为每个字符规定了唯一确定的编号,具体存储成什么样的字节流,取决于字符编码方案。
推荐的Unicode编码是UTF-8,UTF-16
UTF-8 :变长的编码方式,可用1-4字节来表示一个字符