计算机中ASCII，Unicode，UTF-8编码的关系和区别

一. 字节存储

最早的计算机在设计时采用8个比特（bit）作为一个字节（byte），二进制11111111的十进制是255，所以一个字节能表示的最大的整数是255同理，2个字节最大表示的整数是65535,4个字节最大表示的整数是4294967295

ASCII码是单字节编码系统

但是一个字节没法表示处理中文是不够的，于是中国制定了GB2312编码，用来把中文编进去

但是每种语言都做一个编码，而在多语言混合的文本中，由于编码标准的冲突，可能会导致显示乱码的情况发生。

于是诞生了Unicode编码。Unicode把所有语言都统一到一套编码里，这样就不会再有乱码问题了。

Unicode编码将最常用的是用两个字节表示一个字符（如果要用到非常偏僻的字符，就需要4个字节）。但是Unicode编码同样存在着一些缺点

比如，如果你写的文本全部是英文的话，用Unicode编码比ASCII编码需要多一倍的存储空间，在存储和传输上就十分不划算。

所以，本着节约的精神，又出现了把Unicode编码转化为“可变长编码”的UTF-8编码。

UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6个字节，常用的英文字母被编码成1个字节，汉字通常是3个字节，只有很生僻的字符才会被编码成4-6个字节。如果你要传输的文本包含大量英文字符，用UTF-8编码就能节省空间

在计算机内存中，统一使用Unicode编码，当需要保存到硬盘或者需要传输的时候，就转换为UTF-8编码。

用记事本编辑的时候，从文件读取的UTF-8字符被转换为Unicode字符到内存里，编辑完成后，保存的时候再把Unicode转换为UTF-8保存到文件

转载请注明：
本文标题：计算机中ASCII，Unicode，UTF-8编码的关系和区别
本文链接：https://zhangjia.pro/634.html
ps. 如果本文对您有帮助，欢迎扫码赞助本站！ヾ(◍°∇°◍)ﾉﾞ

请登录之后再进行评论