Ir al contenido principal

Criptografía (LXXII): Reto 6

Otro reto fácil sobre criptografía.

Como siempre, se admiten soluciones en forma de comentarios a esta entrada. A lo largo de la semana iré proporcionando pistas para su resolución, un máximo de tres, y posteriormente actualizaré este post con la solución.

Reto 6: "Dime con quién andas y te diré quién eres".

Allá por el siglo IX, Al-Kindi, un filósofo árabe, fue el primero que se dio cuenta, o al menos que lo documentó, de que se podía atacar un texto cifrado mediante la estadística del lenguaje en el que estuviera escrito el texto en claro, ya que ciertas características del mismo se trasladaban al criptograma. Por ello, entiendo que podría ser considerado como el padre del criptoanálisis e incluso como el primer "hacker" de la historia. El análisis de frecuencias consiste, básicamente, en estudiar la frecuencia de aparición en el criptograma de caracteres o símbolos y de grupos de ellos (de ahí el título de este reto) con relación a la frecuencia de las letras y grupos de éstas en el lenguaje en el que esté escrito el texto en claro. ¿Puedes descifrar el criptograma asociado al reto utilizando el análisis de frecuencias?.

Dificultad:
Tipo:          Criptografía.

Recursos:  - Criptograma:
******** 21/11/2017
Pista 1:     En nuestro reto la frecuencia de aparición (porcentaje) de los símbolos en el criptograma comparada con la frecuencia de aparición (porcentaje) de las letras en el idioma español nos dará una pista muy importante sobre qué símbolos pueden corresponderse con las letras del texto en claro. Así, los dos candidatos a ser las letras más frecuentes en español ("E" y "A") serán fácilmente reconocibles con un análisis de frecuencias de los símbolos, ya que éstas son las que presentan una significativa mayor frecuencia de aparición en dicho idioma. Este análisis de frecuencias de monogramas es un muy buen punto de partida, pero, sobretodo en criptogramas no muy largos (éste tiene una longitud de 132 símbolos), debe completarse necesariamente con los correspondientes análisis de bigramas, trigramas, etc. (grupos de dos caracteres o símbolos, de tres, etc.) e incluso de aquellos grupos que podrían formar palabras, por lo que ahora le toca el turno a eso que da título al reto: "Dime con quién andas y te diré quién eres".

******** 22/11/2017
Pista 2:     Del análisis de frecuencias de los símbolos podemos establecer la hipótesis inicial de que los dos que aparecen con mayor frecuencia en el criptograma se corresponden con las letras "E" y "A", respectivamente. Considerando, además, que el criptograma comienza con el candidato a ser la "E", y teniendo siempre presente el porcentaje de aparición de los símbolos, podemos completar nuestra hipótesis estableciendo los candidatos a ser la "O" y la "S", de la siguiente manera (a la izquierda se muestra el porcentaje de aparición de los símbolos en el criptograma y a la derecha el porcentaje de aparición de las letras que se espera encontrar en un texto escrito en español):
Con lo que en una aproximación al texto en claro tendríamos:
Fijándonos en los símbolos enmarcados en color rojo y considerando su porcentaje de aparición en el criptograma creo que no es difícil establecer a qué letras podrían corresponderse en el texto en claro. A partir de aquí, quizás con el análisis de bigramas, trigramas, etc... consigas descifrar completamente el criptograma.

******** 23/11/2017
Pista 3:     Completando nuestra hipótesis con los dos símbolos enmarcados en rojo en la pista anterior, que serían los candidatos a ser la "T" y la "L", respectivamente, hacemos una segunda aproximación al texto en claro:
Considerando esta aproximación, en la que se han enmarcado algunos bigramas y trigamas, teniendo siempre presente el porcentaje de aparición de los símbolos en el criptograma, y teniendo en cuenta que:

- "DE"  y "UE" son los bigramas que terminan en "E" más frecuentes en español,
- "UN" es un bigrama frecuente en español,
- "QUE" es el trigrama más frecuente en español,
- "ADO" y "NTE" son trigramas frecuentes en español,

estoy seguro de que con todo ello puedes ir completando la hipótesis con nuevos símbolos candidatos a letras en el texto en claro e ir haciendo nuevas aproximaciones hasta descifrar completamente el criptograma. 

******** 24/11/2017
Solución.

******** PRÓXIMO RETO
Reto 7:     "Descifrando Enigma".

Comentarios

Entradas populares de este blog

Criptografía (I): cifrado Vigenère y criptoanálisis Kasiski

Hace unos días mi amigo Iñaki Regidor ( @Inaki_Regidor ), a quien dedico esta entrada :), compartió en las redes sociales un post titulado "Criptografía: el arte de esconder mensajes"  publicado en uno de los blogs de EiTB . En ese post se explican ciertos métodos clásicos para cifrar mensajes , entre ellos el cifrado de Vigenère , y , al final del mismo, se propone un reto consistente en descifrar un mensaje , lo que me ha animado a escribir este post sobre el método Kasiski  para atacar un cifrado polialfabético ( conociendo la clave descifrar el mensaje es muy fácil, pero lo que contaré en este post es la forma de hacerlo sin saberla ). El mensaje a descifrar es el siguiente: LNUDVMUYRMUDVLLPXAFZUEFAIOVWVMUOVMUEVMUEZCUDVSYWCIVCFGUCUNYCGALLGRCYTIJTRNNPJQOPJEMZITYLIAYYKRYEFDUDCAMAVRMZEAMBLEXPJCCQIEHPJTYXVNMLAEZTIMUOFRUFC Como ya he dicho el método de Vigenère es un sistema de sustitución polialfabético , lo que significa que, al contrario que en un sistema de

Criptografía (XXIII): cifrado de Hill (I)

En este post me propongo explicar de forma comprensible lo que he entendido sobre el cifrado de Hill , propuesto por el matemático Lester S. Hill , en 1929, y que se basa en emplear una matriz como clave  para cifrar un texto en claro y su inversa para descifrar el criptograma correspondiente . Hay tres cosas que me gustan de la criptografía clásica, además de que considero que ésta es muy didáctica a la hora de comprender los sistemas criptográficos modernos: la primera de ellas es que me "obliga" a repasar conceptos de matemáticas aprendidos hace mucho tiempo y, desgraciadamente, olvidados también hace demasiado tiempo, y, por consiguiente, que, como dice  Dani , amigo y coautor de este blog, me "obliga" a hacer "gimnasia mental"; la segunda es que, en la mayoría de las ocasiones, pueden cifrarse y descifrase los mensajes, e incluso realizarse el criptoanálisis de los criptogramas, sin más que un simple lápiz y papel, es decir, para mi es como un pasat

¿Qué significa el emblema de la profesión informática? (I)

Todas o muchas profesiones tienen un emblema que las representa simbólicamente y en el caso de la  informática: " es el establecido en la resolución de 11 de noviembre de 1977  para las titulaciones universitarias superiores de informática, y  está constituido por una figura representando en su parte central  un  núcleo toroidal de ferrita , atravesado por  hilos de lectura,  escritura e inhibición . El núcleo está rodeado por  dos ramas : una  de  laurel , como símbolo de recompensa, y la otra, de  olivo , como  símbolo de sabiduría. La  corona  será la  de la casa real  española,  y bajo el escudo se inscribirá el acrónimo de la organización. ". Veamos los diferentes elementos tomando como ejemplo el emblema del COIIE/EIIEO (Colegio Oficial de Ingenieros en Informática del País Vasco/ Euskadiko Informatikako Ingeniarien Elkargo Ofiziala ) . Pero no sólo el COIIE/EIIEO adopta el emblema establecido en dicha resolución, sino que éste se adopta también como im