计算机中为什么要对字符进行编码

如题所述

在电脑中输入字符时,电脑要自动把它转换为二进制数,才能存储在电脑中,所以电脑中一定要对字符进行编码,包括ASCII码和汉字编码。

1、由于电路的复杂性因素,电脑中都使用二进制数,只有0和1两个数码,逢二进一,最容易用电路来表达,比如0代表电路不通,1代表电路通畅。平时用电脑时感觉不到它是在用二进制计算是因为电脑会把输入的信息自动转换成二进制,算出的二进制数再转换成能看到的信息显示到屏幕上。

2、ASCII码是由美国信息交换标准码是由美国国家标准学会(American National Standard Institute,ANSI)制定的,标准的单字节字符编码方案,用于基于文本的数据。起始于50年代后期,在1967年定案。它最初是美国国家标准,供不同计算机在相互通信时用作共同遵守的西文字符编码标准,它已被国际标准化组织(ISO)定为国际标准,称为ISO646标准。适用于所有拉丁文字字母。

3、ASCII码使用指定的7位或8位二进制数组合来表示128或256种可能的字符。标准ASCII码也叫基础ASCII码,使用7位二进制数来表示所有的大写和小写字母,数字0到9、标点符号,以及在美式英语中使用的特殊控制字符(这里需要特别注意:ASCII码与标准ASCII码的位数上的区分,标准ASCII码是7位二进制表示)。在电脑里,数字和字母都是用ASCII码来存储的,这就是为什么一个英文字母或半角的数字、标点符号通常占一个字节的原因。

扩展资料:

1、汉字编码:电脑内部汉字信息的存储运算的代码有四种:输入码、国标码、内码和字型码。

(1)输入码:包括拼音编码和字型编码。微软拼音ABC就是拼音编码,五笔字型输入法就是字型编码。

(2)国标码:又称为汉字交换码,在计算机之间交换信息用。用两个字节来表示,每个字节的最高位均为0,因此可以表示的汉字数为2的14次幂,就是16384个。将汉字区位码的高位字节、低位字节各加十进制数32(即十六进制数的20),便得到国标码。例如“中”字的国标码为8680(十进制)或7468(十六进制)。

(3)内码:汉字内码是在设备和信息处理系统内部存储、处理、传输汉字用的代码。无论使用何种输入码,进入计算机后就立即被转换为机内码。规则是将国标码的高位字节、低位字节各自加上128(十进制)或80(十六进制)。例如,“中”字的内码以十六进制表示时应为F4E8。这样做的目的是使汉字内码区别于西文的ASCII,因为每个西文字母的ASCII的高位均为0,而汉字内码的每个字节的高位均为1。

(4)字型码:表示汉字字形的字模数据,因此也称为字模码,是汉字的输出形式。通常用点阵、矢量函数等表示。用点阵表示时,字形码指的就是这个汉字字形点阵的代码。根据输出汉字的要求不同,点阵的多少也不同。简易型汉字为16′16点阵、提高型汉字为24′24点阵、48′48点阵等。如果是24′24点阵,每行24个点就是24个二进制位,存储一行代码需要3个字节。那么,24行共占用3′24=72个字节。

计算公式:每行点数/8′行数。依此,对于48′48的点阵,一个汉字字形需要占用的存储空间为48/8′48=6′48=288个字节。

2、常见ASCII码的大小规则:0~9<A~Z<a~z。

(1)数字比字母要小。如 “7”<“F”;

(2)数字0比数字9要小,并按0到9顺序递增。如 “3”<“8” ;

(3)字母A比字母Z要小,并按A到Z顺序递增。如“A”<“Z” ;

(4)同个字母的大写字母比小写字母要小32。如“A”<“a” 。

(5)几个常见字母的ASCII码大小: “A”为65;“a”为97;“0”为 48。

3、发展轨迹:

(1)1981年IBM PC ROM256个字符的字符集,即IBM扩展字符集 。

(2)1985年11Windows字符集被称作“ANSI字符集”,遵循了ANSI草案和ISO标准(ANSI/ISO8859-1-1987,简“Latin 1”。

(3)为了解决中国、日本和韩国的象形文字符和ASCII的某种兼容性,出现了双字节字符集(DBCS:double-byte character set)。DBCS从 第256 代码开始,就像ASCII一样,最初的128个代码是ASCII。然而,较高的128个代码中的某些总是跟随着第二个字节。这两个字节一起(称作首字节和跟随字节)定义一个字符,通常是一个复杂的象形文字 。

参考资料来源:百度百科 - ASCII编码

参考资料来源:百度百科 - 编码

温馨提示:答案为网友推荐,仅供参考
相似回答