1)数据单位:
位 bit:也称比特,简记b。是计算机存储数据的最小单位。
字节 Byte:简记B。规定1B=8bit。字节是存储信息的基本单位。每个存储单元的大小就是一个字节,所以存储器的容量大小以字节来度量,如KB、MB、GB和TB,其换算关系是:1024 = 210
1TB = 1024GB,1GB = 1024MB,1MB = 1024KB,1KB = 1024B
字 Word:CPU通过数据总线一次存取、加工和传送的数据称为字。
2)数值的表示:
计算机中,所有数据都以二进制的形式表示。通常规定一个数的最高位作为符号位,0表示正,1表示负。
具有数值大小和正负特征的数据成为数值数据。
机器码:BCD码或8421码。
3)字符编码:
ASCII码(美国标准信息交换代码)是一种西文机内码,占用一个字节(8bit),其最高位为0,可表示128个不同的字符。
其中包括数字0-9、26个大写英文字母、26个小写英文字母。
数字的ASCII码 < 大写字母的ASCII码 < 小写字母的ASCII码
小写字母比大写字母大32(20H)。
4)汉字编码:
一般用连续的两个字节(16位)来表示一个汉字。
汉字交换码:即国标码GB2312,收录了6763个汉字,以及682符号,共7445个字符,奠定了中文信息处理的基础,它不能直接在计算机中使用。
汉字机内码:是真正的计算机内部用来存储和处理汉字信息的代码。
国标码 + 8080H = 机内码
汉字输入码:也称为汉字外部码。根据编码规则,这些汉字输入码可分为流水码、音码、形码和音形结合码四种。
◇智能ABC、微软拼音、搜狗拼音和谷歌拼音等为音码。
◇五笔字型、笔画输入法为形码,也叫结构码。
汉字字形码:用来将汉字显示到屏幕上或打印到纸上所需要的图形数据。分为点阵码和矢量码两种。
◇点阵码是一种用点阵表示汉字字形的编码,它把汉字按字形排列成点阵,一个16×16点阵的汉字要占用32个字节,一个32×32点阵的汉字则要占用128字节,而且点阵码缩放困难且容易失真。
16*16 = 256bit = 256/8Byte = 32Byte
32*32 = 1024bit = 1024/8 Byte = 128Byte
◇矢量码占用空间小,缩放简单不易失真。