第三节数制与信息编码
一、数制的基本概念
(一)数制
数制也称计数制,是用一组固定的符号和统一的规则来表示数值的方法。人们通常采用的数制有十进制、二进制、八进制和十六进制。
(二)进位计数制
常用的数制都采用了进位计数制,简称进位制,是按进位方式实现计数的一种规则。进位计数制涉及数码、基数和位权这三个概念。
?数码:一组用来表示某种数制的符号;
?基数:数制所使用的数码个数;
?位权:数码在不同位置上的倍率值,对于N进制数,整数部分第i位的位权为Ni-1,而小数部分第j位的位权为N-j。
常用的数制表示如下。
?十进制(D):有10个基数,为0—9,逢十进一;
?二进制(B):有2 个基数,为0 和1,逢二进一;
?八进制(O):有8个基数,为0—7,逢八进一;
?十六进制(H):有16个基数,分别为0—9与A—F,逢十六进一。
(三)常用数制的书写形式
在书写时,为了区别不同的数制,可采用以下两种方法表示。
1.用一个下标来表示
例如:(10)10(10)2(10)16
十进制二进制十六进制
2.用数值后面加上特定的字母来表示
例如:10D10B10H
十进制二进制十六进制
其中,在表示十进制时,D可以省略。
?经典例题
对于下面十进制数与二进制数的大小关系,成立的是()。
A. (10)10(1010)2
C. (10)10=(1010)2D. (10)10<(1000)2
【答案】 C
【名师点评】 此题考查十进制数和二进制数之间相互转换的计算。将十进制数转化为二进制数的方法是:“除以2取余,逆序排列”。以题中十进制数10为例:
10÷2……0
5÷2……1
2÷2……0
1
后面的数字按照逆序排列,即可得10转换为二进制数是1010。所以本题的答案选C。
二、不同进制之间的转换
(一)其他进制转换为十进制
方法是:将其他进制按权位展开,然后把各项相加,就得到了相应的十进制数。
例如: N=(10110.101)B=(?)D
按权展开:N=1×24+0×23+1×22+1×21+0×20+1×2-1+0×2-2+1×2-3=16+4+2+0.5+0.125 =(22.625)D
(二)将十进制转换成其他进制
方法是:分两部分进行,即将整数部分和小数部分分别进行转换,然后将转换后的代码组合在一起。
整数部分:辗转相除法
1.把要转换的数除以目标进制的基数,把余数作为目标进制的*低位;
2.把上一次得的商再除以目标进制的基数,把余数作为目标进制的次低位;
3.继续上一步,直到*后的商为零,这时的余数就是目标进制的*高位。
小数部分:辗转相乘法
1.把要转换数的小数部分乘以目标进制的基数,把得到的整数部分作为目标进制小数部分的*高位;
2.把上一步得的小数部分再乘以目标进制的基数,把整数部分作为目标进制小数部分的次高位;
3.继续上一步,直到小数部分变成零或达到预定的要求为止。
(三)二进制与八进制、十六进制的相互转换
二进制转换为八进制、十六进制:它们之间满足23和24的关系,因此把要转换的二进制从低位到高位每3位或4位一组,高位不足时在有效位前面添0,然后把每组二进制数转换成八进制或十六进制即可。
八进制、十六进制转换为二进制时,把上面的过程逆过来即可。
例如,(C1B)H=(?)B
十六进制: C1B
二进制数:1100 0001 1011
?经典例题
1.八进制数32转换为二进制数是()。
A. 11010 B. 10111 C. 10101 D. 10000
【答案】 A
【名师点评】 八进制数转换成二进制数只需将每一位八进制数转换成相应的二进制数即可。
2.将十进制数0.25转换成二进制数是()。
A. 0.01 B. 0.1 C. 0.001 D. 0.11
【答案】 A
【名师点评】 0.25×2=0.5(整数部分为零,取0),0.5×2=1(整数部分为1,取1),因此*终结果为0.01。
三、计算机中字符的编码
(一)西文字符的编码
微型机采用ASCII码。ASCII码是美国标准信息交换码,被国际标准化组织(ISO)指定为国际标准,ASCII码有7位码和8位码两种版本。国际通用的7位ASCII码称为ISO?646标准,用7位二进制数b6b5b4b3b2b1b0表示一个字符的编码,其编码范围为0000000B—1111111B,共有27=128个不同的编码值。扩展的ASCII码使用8位二进制位表示一个字符的编码,可表示28=256个不同字符的编码。
(二)汉字的编码
1.汉字信息交换码(国标码)
汉字交换码是指不同的具有汉字处理功能的计算机系统之间在交换汉字信息时所使用的代码标准。自**标准GB2312?80公布以来,我国一直沿用该标准所规定的国标码作为统一的汉字信息交换码。 GB2312?80 标准包括了6763个汉字,按其使用频度分为一级汉字3755个和二级汉字3008个。一级汉字按拼音排序,二级汉字按部首排序。此外,该标准还包括标点符号、数种西文字母、图形、数码等符号 682 个。
区位码的区码和位码均采用从01到94的十进制,国标码采用十六进制的21H到73H(数字后加H表示其为十六进制数)。区位码和国标码的换算关系是:区码和位码分别加上十进制数32。如“国”字在表中的25行90列,其区位码为2590,国标码是397AH。
2.汉字输入码
为将汉字输入计算机而编制的代码称为汉字输入码,也称外码。目前汉字主要是经标准键盘输入计算机的,所以汉字输入码都是由键盘上的字符或数字组合而成。
3.汉字内码
汉字内码是计算机内部对汉字进行存储、处理和传输的汉字代码,它可以满足存储、处理和传输的要求。当一个汉字输入计算机后就被转换为内码,然后才能在机器内传输、处理。汉字内码的形式是多种多样的。
4.汉字字形码
输出汉字时,根据内码在字库中查到其字形描述信息,然后显示和打印输出。描述汉字字形的方法主要有点阵字形和轮廓字形两种。汉字字形通常分为通用型和精密型。通用型汉字字形点阵分成3种:简易型16×16点阵;普通型24×24点阵;提高型32×32点阵。精密型汉字字形用于常规的印刷排版,通常采用信息压缩存储技术。汉字的点阵字形的缺点是放大后会出现锯齿现象,很不美观。
5.汉字地址码
汉字地址码是指汉字库中存储汉字字形信息的逻辑地址码。
6.各种汉字代码之间的关系
汉字的输入、处理和输出的过程,实际上是汉字的各种代码之间的转换过程,或者是说汉字代码在系统有关部件之间流动的过程。汉字输入码向内码的转换,是通过使用输入字典实现的。
7.汉字字符集简介
GB2312?80汉字编码:GB2312码是中华人民共和国**标准汉字信息交换用编码,习惯上称为国际码、GB码或区位码。它是一个简化字汉字的编码。
GBK编码:GBK也是一个汉字编码标准。GBK向下与GB2312?80编码兼容,向上支持ISO 10646.1标准。
GB18030?2000汉字编码:GB18030?2000编码标准是在原GB2312?80编码标准和GBK编码标准的基础上扩展而成的。GB18030?2000支持全部CJK统一汉字字符。
BIG?5码:通行于中国台湾、香港地区的一个繁体字编码方案,俗称“大五码”,广泛应用于计算机业和因特网。
?经典例题
计算机中广泛使用的信息交换符号编码是()。
A. 机器码B. 汉字编码
C. ASCⅡ码D. BCD码
【答案】 C
【名师点评】 计算机中普遍采用的是美国标准信息交换码,即ASCII 码。