各种计算机编码的区别

1. ASCII方案:

  • 一开始的计算机标准, 用于存储空格,标点符号,数字,大小写字母等;(美国信息互换标准代码)

2.GB2312方案:

  • 为了弥补ASCII无法显示中文, 规定127后的两个字符连在一起, 组成两字节长的编码(全角), 用于显示简体汉字;

3.GBK标准:

  • 汉字太多,导致规定只要是高字节是127以后的,就是一个汉字的开始, 而后面可以跟着非127以后的;

4.GB18030:

  • 扩展少数民族的字;

5.”DBCS”(Double Byte Charecter Set 双字节字符集),

  • 最大特点就是双字节的汉字和一字节长的英文字符并存;上面的GBK就是;这些字符集的特点在于都是区域性定制的; 比较难以沟通;

6.UNICODE:

  • 国际标准化组织制定的编码, 废除地区制定的编码;
  • 全部用两个字节来表示编码, 对于英文会浪费一半的空间;
  • 对于GBK等其他编码没有考虑任何兼容;

7.UCS-4:

  • 用4个字节来表示一个字符;
  • 未来才可能启用;

8.UTF-8是Unicode的实现方式之一

  • 用于在网络传输;
  • 一种变长的编码方式, 可以使用1~4个字节来表示一个符号, 根据不同的符号而变化字节长度;
  • 兼容ASCII编码;

9.UTF-16和UTF-32

  • 不兼容ASCII编码;
  • UTF-32固定用四个字节存储;
  • UTF-16, 使用2~4个字节来表示一个符号;

10.ANSI

  • windows记事本默认的编码, 对于英文文件是用ASCII编码, 对于简体中文是用GB2312编码;(繁体中文会用Big5码)

11.ISO-8859-1

  • 对于ASCII的一种扩展, 用于欧洲等英文语系的国家;
  • 单字节编码形式;
hyhcoder wechat
扫码关注我的个人订阅号