请教一个关于汉字机内码存储的问题

“囍”这个字在记事本以ANSI方式存储的机内码是87 D6,大小两个字节,而GB 2312-80中没有这个汉字!这是为什么?而以Unicode方式存储时,机内码成了FF FE CD 56,机内码为什么变了呢?再怎么和GB 2312-80标准对应呢?大小成了四个字节,不是一个汉字用两个字节存储吗?
希望百度达人们能够解决我的疑问

GB 2312-80 收录简化汉字及一般符号、序号、数字、拉丁字母、日文假名、希腊字母、俄文字母、汉语拼音符号、汉语注音字母,共 7445 个图形字符。其中汉字以外的图形字符682 个,汉字 6763 个。

  GB 2312-80 规定,“对任意一个图形字符都采用两个字节(Byte)表示。每个字节均采用 GB 1988-80 及 GB 2311-80 中的七位编码表示。两个字节中前面的字节为第一字节,后面的字节为第二字节。”习惯上称第一字节为“高字节”,第二字节为“低字节”。

  GB 2312-80 将代码表分为 94 个区(Section),对应第一字节;每个区 94 个位(Position),对应第二字节。两个字节的值,分别为区号值和位号值各加 32(20H)。

  GB 2312-80 规定,01~09 区(原规定为 1~9 区,为表示区位码方便起见,今改称01~09 区)为符号、数字区,16~87 区为汉字区。而 10~15 区、88~94 区是有待于“进一步标准化”的“空白位置”区域。但第 10 区推荐与第 3 区的 94 个图形字符(即 GB 1988-80 中的 94 个图形字符)相同,字形宽度为其宽度的一半
温馨提示:答案为网友推荐,仅供参考
第1个回答  2011-11-21
3.16×16点阵的一个汉字字形需要多少个字节来存储?看到回答是32 但是看到和真的空间机内码:计算机中字符的实际存储码。如西文字符,在计算机中是以
第2个回答  2011-11-21
金卡家肯德基啊设计单位
第3个回答  2011-11-21
GB 2312-80又称为国标码,机内码称为区位码,它是由94个区x94位(编号由01到94)组成汉字字符集。区位码与国标码的其转换方法为:先将十进制区码和位码转换为十六进制的区码和位码,再将这个代码的第一个字节和第二个字节分别加上20H,就得到国标码。之所以这样主要是为了避开每个字节的低7为不出现控制字符(0-20H)。它们都是2字节。
至于Unicode也称为全球文字编码,它由4字节组成。东亚字符(包括中文繁简体、日文及朝鲜文)共计20000余个。其他如希腊文、印度文及其他文字等。
希望对你有用。
第4个回答  2011-11-23
设计单位
相似回答