Una máquina almacena números en punto flotante en 10 bits. El primer bit se usa para el signo del número, los cuatro siguientes para el exponente sesgado y los últimos cinco bits para la magnitud de la mantisa. Si se sigue un criterio similar al de la norma IEEE 754:
Tenemos $m=4$ bits para el exponente. Por lo tanto hay $2^m = 2^4 = 16$ combinaciones distinta y, en principio, podemos representar $16$ números. Como empezamos el valor nominal empieza en $0$ acabará en $15$. El primer número, $\mathtt{0000}$, y el último, $\mathtt{1111}$ se reservan. Y como la representación es sesgada, tenemos que restar el $$sesgo=2^{m-1}-1=2^{4-1}-1 =2^3-1= 8-1 = 7$$ para obtener el valor representado
El valor nominal del exponente $\mathtt{{\color{red}{0110}}}$ teniendo en cuenta la posición de cada dígito
$$ \begin{array}{cccc} \tiny{(3)}&\tiny{(2)}&\tiny{(1)}&\tiny{(0)}\\ \mathtt{0}&\mathtt{1}&\mathtt{1}&\mathtt{0} \end{array} $$es
$$2^2+2^1=4+2=6$$Y si tenemos en cuenta que para $m=4$ bits, $sesgo = 7$
El valor del exponente es $6-7=-1$.
Los dígitos almacenados de la mantisa son $\mathtt{{\color{ForestGreen}{11010}}}$ y teniendo en cuenta el bit escondido, que es uno, la mantisa es
$$\mathtt{1,{\color{ForestGreen}{11010}}}$$que teniendo en cuenta la posición respecto a al coma
$$ \begin{array}{ccccc} \tiny{(0)}&&\tiny{(-1)}&\tiny{(-2)}&\tiny{(-3)}&\tiny{(-4)}&\tiny{(-5)}\\ \mathtt{1}&,&\mathtt{{\color{ForestGreen}1}}&\mathtt{{\color{ForestGreen}1}}&\mathtt{\color{ForestGreen}0}&\,\mathtt{{\color{ForestGreen}1}}&\mathtt{\color{ForestGreen}0} \end{array} $$Por lo tanto, si escribimos el número este es
$${\color{red}-}\mathtt{1,{\color{ForestGreen}{11010}}}\times 2^{\color{red}{-1}} \quad \longrightarrow \quad -(1+2^{-1}+2^{-2}+2^{-4})\times2^{-1} = \fbox{$-$0,90625} $$Recordemos que el formato es
Se define el $\epsilon$ de máquina como la distancia entre el número $1$ y es siguiente número representable de forma exacta en este estándar.
Recordemos que en este estándar el $1$ y el siguiente número son
Calculamos la distancia restando estos dos valores
Mayor entero que se puede almacenar de forma exacta de forma que el siguiente entero no se puede almacenar de forma exacta
En este formato disponemos de $5$ bits más el bit escondido, es decir, que podemos almacenar $6$ dígitos significativos.
Por lo tanto, el mayor entero del que podemos almacenar todos los dígitos es
$$\mathtt{1\,11111} \quad\rightarrow\quad \mathtt{1,\,11111}\times 2^{5} $$El número siguiente es
$$\mathtt{10\overbrace{0000{\color{red}0}}^{5\,bits}}= \mathtt{1\overbrace{00000}^{5\,bits}{\color{red}0}}\quad\rightarrow\quad \mathtt{1,\,\overbrace{00000}^{5\,bits}}\times 2^{6}$$del cual no podemos almacenar el cero $\mathtt{{\color{red}0}}.$ Y como es un cero no hay error. Este número es
$$\fbox{$2^{6}=64$}$$El número entero siguiente
$$\mathtt{10\overbrace{0000{\color{red}1}}^{5\,bits}}= \mathtt{1\overbrace{00000}^{5\,bits}{\color{red}1}}\quad\rightarrow\quad \mathtt{1,\,\overbrace{00000}^{5\,bits}}\times 2^{6}$$y no podemos almacenar el uno $\mathtt{{\color{red}1}}$ y lo tenemos que redondear al número anterior o al siguiente (en este caso al anterior) y no lo podemos representar de forma exacta.
Si volvemos al primer apartado, podemos ver que el exponente mínimo es $\begin{array}{|c|}\hline e_{min}=-6\\ \hline\end{array}$ y el máximo es $\begin{array}{|c|}\hline e_{max}=7\\ \hline\end{array}.$
Tendrá mantisa mínima y exponente mínimo. En este formato
El exponente no puede ser $\mathtt{0000}$ porque está reservado. Para este número
$$\mathtt{1,00000}\times 2^{-6}\quad\longrightarrow\quad 2^{-6}=\fbox{0,015625}$$Su precisión es $\fbox{$p=6$}$ porque tiene 6 dígitos, 5 que se almacenan más el bit escondido.
El siguiente número representable de forma exacta sería
$$\mathtt{1,00001}\times 2^{-6}$$Y el espacio (diferencia) entre los dos sería
$$\mathtt{0,00001}\times 2^{-6}\quad\longrightarrow\quad 2^{-5}\times 2^{-6}=2^{-11}= \fbox{0,00048828125}$$Tendrá mantisa máxima y exponente máximo. En este formato
El exponente no puede ser $\mathtt{1111}$ porque está reservado. Para este número
$$\mathtt{1,11111}\times 2^{7}\quad\longrightarrow\quad (1+2^{-1}+2^{-2}+2^{-3}+2^{-4}+2^{-5})\times 2^{7}=\fbox{252}$$Su precisión es $\fbox{$p=6$}$ porque tiene 6 dígitos, 5 que se almacenan más el bit escondido.
El anterior número representable de forma exacta sería
$$\mathtt{1,11110}\times 2^{7}$$Y el espacio (diferencia) entre los dos sería
$$\mathtt{0,00001}\times 2^{7}\quad\longrightarrow\quad 2^{-5}\times 2^{7}=2^{2}= \fbox{4}$$Para $m = 4$ bits de exponente tenemos $2^m$ números distintos pero como el primero $\mathtt{0000}$ y el último $\mathtt{1111}$ están reservados tenemos
$$2^m-2=2^4-2=16-2=14\;\mathrm{exponentes}$$Para $n = 5$ bits de mantisa tenemos $2^n$ números distintos. El bit escondido es siempre 1, así que no aporta nuevos valores y tenemos
$$2^n=2^5=32\;\mathrm{mantisas}$$y en total
$$14\,\mathrm{exponentes}\times32\,\mathrm{mantisas} = \fbox{448 números normalizados positivos}$$Los números desnormalizados se caracterizan porque:
Tendrá exponente todo ceros y mantisa mínima (no vale todo ceros que respresentaría el cero)
Que representa
$$\mathtt{0,00001}\times 2^{-6}\quad\longrightarrow\quad 2^{-5}\times2^{-6}=2^{-11}=\fbox{0,00048828125}$$Su precisión es $\fbox{$p=1$}$ porque tiene 1 dígito significativo (los ceros a la izquierda no cuentan).
El siguiente número representable de forma exacta sería
$$\mathtt{0,00010}\times 2^{-6}$$Y el espacio (diferencia) entre los dos sería
$$\mathtt{0,00001}\times 2^{-6}\quad\longrightarrow\quad 2^{-5}\times 2^{-6}=2^{-11}= \fbox{0,00048828125}$$Tendrá exponente todo ceros y mantisa máxima
Que representa
$$\mathtt{0,11111}\times 2^{-6}\quad\longrightarrow\quad (2^{-1}+2^{-2}+2^{-3}+2^{-4}+2^{-5})\times 2^{-6}=\fbox{0,01513671875}$$Su precisión es $\fbox{$p=5$}$ porque tiene 5 dígitos significativos.
El anterior número representable de forma exacta sería
$$\mathtt{0,11110}\times 2^{-6}$$Y el espacio (diferencia) entre los dos sería
$$\mathtt{0,00001}\times 2^{-6}\quad\longrightarrow\quad 2^{-5}\times 2^{-6}=2^{-11}= \fbox{0,00048828125}$$Tenemos un único exponente que es $\mathtt{0000}.$
Para $n = 5$ bits de mantisa tenemos $2^n$ números distintos. El bit escondido es siempre 0, así que no aporta nuevos valores y tenemos
Y tenemos $$2^n-1=2^5-1=32-1\;\mathrm{mantisas}$$ porque hemos de quitarle la que es todo ceros que representa el cero.
Y en total
$$1\,\mathrm{exponente}\times31\,\mathrm{mantisas} = \fbox{31 números desnormalizados positivos}$$Recordemos que el formato es
Por convenio, el cero se representa con todos los bits del exponente y la mantisa cero.
Por convenio, el infinito se representa con todos los bits del exponente 1 y todos los bits de la mantisa 0
Por convenio, $\mathtt{NaN}$ se representa con todos los bits del exponente 1 y los bits de la mantisa con cualquier combinación que no sean todos ceros, por ejemplo
La parte entera es $1$ en base $2$ y en base $10$
Multiplicamos por $2$, restamos la parte entera y repetimos hasta que la parte fraccionaria sea cero.
$$\begin{array}{lccccccc} 0,5625 &\times& 2 &= &1,125 &\rightarrow & 1 & \downarrow\\ 0,125 &\times& 2 &= &0,25 &\rightarrow & 0 & \downarrow\\ 0,25 &\times& 2 &= &0,5 &\rightarrow & 0 & \downarrow\\ 0,5&\times& 2& = &1,0&\rightarrow & 1& \downarrow \end{array}$$Empezamos por el la primera parte entera y el número en binario es $\mathtt{0,1001}$
Y el número completo es
$$(1,5625)_{10} = (\mathtt{1,1001})_2$$Este número normalizado sería
$$-\mathtt{1,1001}\times2^0$$con
Como el signo es negativo $\longrightarrow$ signo $\mathtt{1}$
Tenemos $m=4$ bits para el exponente. Por lo tanto hay $2^m = 2^4 = 16$ combinaciones distinta y, en principio, podemos representar $16$ números. Como empezamos el valor nominal empieza en $0$ acabará en $15$. El primer número, $\mathtt{0000}$, y el último, $\mathtt{1110}$ se reservan. Y como la representación es sesgada, tenemos que restar el $sesgo=2^{m-1}-1=2^{4-1}-1 =2^3-1= 8-1 = 7$ para obtener el valor representado
El valor del exponente es $0$. Para obtener el valor nominal tenemos que sumarle el sesgo y $0+7=7$ que en binario sería
es decir
$$(7)_{10} = (\mathtt{111})_2$$Y completamos con un cero a la izquierda