过去咱们对于中文字符集中的几个编码方式的区别分的不是很清楚,过去我也一直以为GB2312就是GBK呢。原来啊,他们还是有区别的,最大的区别就是包含的汉字数量不一样。当然在常用字方面,你可以认为用GB2312就足够了。
来让我们来看看正确的资料:
中文字符集:
GB2312:包含6763个汉字。
GBK:包含21003个汉字。GBK兼容GB2312,也就是说用GB2312编码的汉字可以用GBK来解码。
GB18030:收录了70000个汉字,这么多是因为包含了少数民族文字。同样兼容GBK和GB2312。
Unicode:Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。具有多种编码方式,如UTF-7、 UTF-8、UTF-16、UTF-32等。
感谢大家的收看,我们下期再见!
如果你觉得内容不错的话,欢迎点赞,评论和分享哟~
评论