中文字符集有哪些?它们又有什么区别呢?看完你就懂了

avatar 2018年9月26日09:54:39 评论 2,597

过去咱们对于中文字符集中的几个编码方式的区别分的不是很清楚,过去我也一直以为GB2312就是GBK呢。原来啊,他们还是有区别的,最大的区别就是包含的汉字数量不一样。当然在常用字方面,你可以认为用GB2312就足够了。

来让我们来看看正确的资料:

中文字符集:

GB2312:包含6763个汉字。

GBK:包含21003个汉字。GBK兼容GB2312,也就是说用GB2312编码的汉字可以用GBK来解码。

GB18030:收录了70000个汉字,这么多是因为包含了少数民族文字。同样兼容GBK和GB2312。

Unicode:Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。具有多种编码方式,如UTF-7、 UTF-8、UTF-16、UTF-32等。

 

 

感谢大家的收看,我们下期再见!

avatar

发表评论

您必须才能发表评论!