IEEE 浮点表示形式

来源:百度文库 编辑:神马文学网 时间:2024/06/03 11:26:06
Microsoft Visual C++ 与 IEEE 数值标准一致。存在实数的三种内部变化。在 Visual C++ 中使用 Real*4 和 real*8。Real*4 用字 float 声明。Real*8 用字 double 声明。在 Windows 32 位编程中,long double 数据类型映射为 double。然而,对使用 real*10 数据类型的计算有汇编语言支持。
值如下存储:
值存储为
real*4符号位、8 位指数、23 位尾数
real*8符号位、11 位指数、52 位尾数
real*10符号位、15 位指数、64 位尾数
在 real*4 和 real*8 格式中,尾数中有一个假定的前导 1,而它并没有存储在内存中,因此尾数实际上是 24 位或 53 位,即使只存储了 23 位或 52 位。real*10 格式实际存储此位。
指数偏离可能值的一半。这表示实际的指数是从存储指数中减去此偏差获得的。如果存储指数小于此偏差,则它实际上是负指数。
指数如下偏离:
指数偏离量
8 位 (real*4)127
11 位 (real*8)1023
15 位 (real*10)16383
这些指数不是 10 的幂;它们是 2 的幂。也就是说,8 位存储指数最多可以为 127。值 2**127 大约等于 10**38,这是 real*4 的实际限制。
尾数被存储为 1.XXX... 形式的二进制分数。. 此分数有一个大于或等于 1 且小于 2 的值。注意实数总是以规范化形式存储;即尾数左移以使尾数的高序位总是 1。因为该位总是 1,所以在 real*4 和 real*8 格式中采用(而不是存储)它。假定二进制(不是十进制)点刚好在前导 1 的右边。
因此,各种大小的格式如下:
格式字节 1字节 2字节 3字节 4...字节 n
real*4SXXX XXXXXMMM MMMMMMMM MMMMMMMM MMMM
real*8SXXX XXXXXXXX MMMMMMMM MMMMMMMM MMMM...MMMM MMMM
real*10SXXX XXXXXXXX XXXX1MMM MMMMMMMM MMMM...MMMM MMMM
S 表示符号位,X 是指数位,M 是尾数位。注意最左边的位在 real*4 和 real*8 格式中被采用,但它在 real*10 格式的字节 3 中以 1 表示。
若要适当地变换二进制点,首先取消阶码,然后将二进制点向左或向右移动适当的位数。
示例
下面是 real*4 格式的一些示例: 在下面的示例中,符号位是零,存储指数是 128,以二进制表示则为 100 0000 0,即 127 加 1。000 0000 ... 存储尾数是 (1.)000 0000 ... 0000 0000,它有一个隐含的前导 1 和二进制点,因此实际的尾数是 1。 SXXX XXXX XMMM MMMM ... MMMM MMMM2 = 1 * 2**1 = 0100 0000 0000 0000 ... 0000 0000 = 4000 0000除了设置符号位外与 +2 相同。这适用于所有 IEEE 格式的浮点数。 -2 = -1 * 2**1 = 1100 0000 0000 0000 ... 0000 0000 = C000 0000尾数相同,指数增加 1(偏差值是 129 或者二进制的 100 0000 1)。 4 = 1 * 2**2 = 0100 0000 1000 0000 ... 0000 0000 = 4080 0000指数相同,尾数大一半 — 它是 (1.)100 0000 ...0000 0000,由于这是二进制分数,即 1 1/2(分数位数的值是 1/2、1/4、1/8 等等)。 6 = 1.5 * 2**2 = 0100 0000 1100 0000 ... 0000 0000 = 40C0 0000指数与其他 2 的幂相同,尾数是 127 或二进制的 011 1111 1 处小于 2 的 1。 1 = 1 * 2**0 = 0011 1111 1000 0000 ... 0000 0000 = 3F80 0000阶码是 126(它是二进制中的 011 1111 0),尾数是 (1.)100 0000 ... 0000 0000,表示 1 1/2。 .75 = 1.5 * 2**-1 = 0011 1111 0100 0000 ... 0000 0000 = 3F40 0000除了在尾数中设置表示 1/4 的位,完全与 2 相同。 2.5 = 1.25 * 2**1 = 0100 0000 0010 0000 ... 0000 0000 = 4020 00001/10 在二进制中是重复的分数。尾数害怕 1.6,而阶码假定 1.6 被 16 除(它是二进制中的 011 1101 1,十进制中是 123)。实际的指数是 123 – 127 = –4,表示乘法因数是 2**–4 = 1/16。请注意,存储尾数在最后一位被舍入(尝试尽可能精确地表示无法表示的数)。(1/10 和 1/100 在二进制中表示不严格的原因类似于 1/3 在十进制中表示不严格的原因。) 0.1 = 1.6 * 2**-4 = 0011 1101 1100 1100 ... 1100 1101 = 3DCC CCCD0 = 1.0 * 2**-128 = all zeros--a special case.