上QQ阅读APP看书,第一时间看更新
1.4.2 计算机中非数值数据的表示
信息一般表示为数据、图形、声音、文本和图像,在计算机中只能识别二进制数,因此需要对信息进行编码。
●字母和常用符号的编码:常用的英文字母有大、小写字母各26个,数码10个,数学运算符号、标点符号及其他无图形符号等共128个。这些符号所采用的编码方案不同,而ASCII编码方案是使用最广泛的。ASCII编码在初期主要在远距离和无线通信中使用,为及时发现传输中因电磁干扰导致的代码出错,设计了几种校验的方法,采用最多的是奇偶校验,即在7位ASCII编码前加1位作为校验位,形成8位编码。其中,偶校验是选择校验位的状态,让包括校验位在内的编码所有为“1”的位数的和是偶数。
●汉字编码:汉字编码处理与西文的区别很大,根据处理阶段的不同,可将汉字编码分为输入码、显示字形码、机内码和交换码。汉字输入码如今已经有数百种,广泛应用的包括自然码、全/双拼音码、五笔字型码等。目前,表示汉字字形常用矢量法与点阵字形法。汉字的输入码、字形码、机内码均不是唯一的,不方便进行不同计算机系统之间的汉字信息交换。