criptoanalisis - analisis frecuencias

4
Análisis de frecuencias 1 Análisis de frecuencias Se ha sugerido que este artículo o sección sea fusionado con Frecuencia_de_aparición_de_letras (ver la discusión al respecto). Una vez que hayas realizado la fusión de artículos, pide la fusión de historiales en WP:TAB/F. Frecuencia de las letras en un texto inglés Frecuencia de las letras en un texto español En el criptoanálisis, el análisis de frecuencias es el estudio de la frecuencias de las letras o grupos de letras en un texto cifrado. Es un método de apoyo para la ruptura de cifrados clásicos. El análisis de frecuencias está basado en el hecho de que, dado un texto, ciertas letras o combinaciones de letras aparecen más a menudo que otras, existiendo distintas frecuencias para ellas. Es más, existe una distribución característica de las letras que es prácticamente la misma para la mayoría de ejemplos de ese lenguaje. Por ejemplo, en inglés la letra E es muy común, mientras que la X es muy rara. Igualmente, las combinaciones ST, NG, TH y QU son pares de letras comunes, mientras que NZ y QJ son raros. La frase mnemotécnica "ETAOIN SHRDLU" agrupa las doce letras más frecuentes en los textos ingleses. En español, las vocales son muy frecuentes, ocupando alrededor del 45% del texto, siendo la E y la A las que aparecen en más ocasiones, mientras que la frecuencia sumada de F, Z, J, X, W y K no alcanza el 2%. En algunos cifradores, las propiedades naturales del texto plano se preservan en el texto cifrado. Dichos esquemas pueden ser potencialmente objeto de ataques de sólo texto cifrado. Análisis de frecuencia para algoritmos de sustitución simple En un algoritmo de sustitución simple, cada letra del texto plano se reemplaza por otra y una letra dada del texto plano siempre será transformada en la misma letra en el mensaje cifrado. Por ejemplo, todas las e se convertirán en X. Un texto cifrado con una alta frecuencia de letras X podría sugerir al criptoanalista que la X representa a la letra e. El uso básico del análisis de frecuencias consiste en primero calcular la frecuencia de las letras que aparecen en el texto cifrado y luego asociar letras de texto plano a ellas. Una gran frecuencia de X podría sugerir que las X son e, pero esto no es siempre cierto, ya que las letras a y o tienen una frecuencia muy alta también en español. Sin embargo, si será difícil que las X representen, en este caso a la k o a la w. Por ello, el criptoanalista podría tener que intentar varias combinaciones hasta descifrar el texto.

Upload: g-hoyos-a

Post on 23-Jun-2015

604 views

Category:

Documents


6 download

TRANSCRIPT

Análisis de frecuencias 1

Análisis de frecuencias

Se ha sugerido que este artículo o sección sea fusionado con Frecuencia_de_aparición_de_letras (ver la discusión alrespecto).

Una vez que hayas realizado la fusión de artículos, pide la fusión de historiales en WP:TAB/F.

Frecuencia de las letras en un texto inglés

Frecuencia de las letras en un texto español

En el criptoanálisis, el análisis de frecuencias es elestudio de la frecuencias de las letras o grupos de letrasen un texto cifrado. Es un método de apoyo para laruptura de cifrados clásicos.

El análisis de frecuencias está basado en el hecho deque, dado un texto, ciertas letras o combinaciones deletras aparecen más a menudo que otras, existiendodistintas frecuencias para ellas. Es más, existe unadistribución característica de las letras que esprácticamente la misma para la mayoría de ejemplos deese lenguaje. Por ejemplo, en inglés la letra E es muycomún, mientras que la X es muy rara. Igualmente, lascombinaciones ST, NG, TH y QU son pares de letrascomunes, mientras que NZ y QJ son raros. La frasemnemotécnica "ETAOIN SHRDLU" agrupa las doceletras más frecuentes en los textos ingleses. En español,las vocales son muy frecuentes, ocupando alrededor del45% del texto, siendo la E y la A las que aparecen enmás ocasiones, mientras que la frecuencia sumada de F,Z, J, X, W y K no alcanza el 2%.

En algunos cifradores, las propiedades naturales deltexto plano se preservan en el texto cifrado. Dichosesquemas pueden ser potencialmente objeto de ataquesde sólo texto cifrado.

Análisis de frecuencia paraalgoritmos de sustitución simple

En un algoritmo de sustitución simple, cada letra deltexto plano se reemplaza por otra y una letra dada deltexto plano siempre será transformada en la misma letra en el mensaje cifrado. Por ejemplo, todas las e seconvertirán en X. Un texto cifrado con una alta frecuencia de letras X podría sugerir al criptoanalista que la Xrepresenta a la letra e.

El uso básico del análisis de frecuencias consiste en primero calcular la frecuencia de las letras que aparecen en eltexto cifrado y luego asociar letras de texto plano a ellas. Una gran frecuencia de X podría sugerir que las X son e,pero esto no es siempre cierto, ya que las letras a y o tienen una frecuencia muy alta también en español. Sinembargo, si será difícil que las X representen, en este caso a la k o a la w. Por ello, el criptoanalista podría tener queintentar varias combinaciones hasta descifrar el texto.

Análisis de frecuencias 2

Estadísticas más complejas podrían ser usadas, como considerar los pares de letras o incluso tríos. Esto se realizapara proporcionar más información al criptoanalista. Por ejemplo, las letras q y u van casi siempre juntas en español,mientras que la q sola es muy rara.

Uso en la Historia

Primera página de Un manuscrito para eldescifrado de mensajes criptográficos, de

Al-Kindi

La primera explicación bien documentada del análisis de frecuencias(de hecho de cualquier tipo de criptoanálisis) fue dada en el siglo IXpor el filósofo árabe Al-Kindi en Un manuscrito para el descifrado demensajes criptográficos (Ibraham, 1992). Se ha sugerido que el estudiointento del Corán desveló que el árabe tenía una característicafrecuencia de letras. Su uso se extendió y fue tan usado en Europadurante el Renacimiento que se inventaron pautas para tratar de burlarel estudio de las frecuencias. Éstas incluían:

• El uso de alternativas para las letras más comunes. Así, por ejemplo,las letras X e Y encontradas en el texto cifrado podrían significar Een el texto plano.

• Cifrado polialfabético, esto es, el uso de varios alfabetos para elcifrado. Leone Alberti parece ser el primero en sugerir esto.

• Sustitución poligráfica, esquemas donde pares o tríos de letras erancifradas como una única unidad. Por ejemplo, el cifrado de Playfair, inventado por Charles Wheatstone amediados del siglo XIX.

Una desventaja de todos estos intentos de derrotar el análisis de frecuencias es que complicaban tanto el cifradocomo el descifrado de los datos, provocando errores.Las máquinas de rotores de la primera mitad del siglo XX (por ejemplo, Enigma) eran esencialmente inmunes alanálisis de frecuencias directo, aunque otros tipos de análisis consigueron decodificar los mensajes de tales aparatos.El análisis de frecuencias sólo requiere un conocimiento básico de las estadísticas del texto plano y cierta periciaresolviendo problemas. Durante la Segunda Guerra Mundial, tanto los británicos como los estadounidensesreclutaron rompecódigos colocando puzzles y crucigramas en los periódicos y realizando concursos para ver quienlos resolvía más rápidamente. Muchos de los cifrados usados por el Eje eran vulnerables al análisis de frecuencias(por ejemplo, algunos de los mensajes cifrados usados por los consulados japoneses). Los métodos mecánicos delconteo de letras y el análisis de las estadísticas (generalmente máquinas de tarjetas perforadas de IBM) fueron usadasdurante la II Guerra Mundial, siendo probablemente los miembros del SIS norteamericano los pioneros. Hoy en día,el trabajo de contar letras y analizar frecuencias ha sido dejado a programas informáticos, que pueden realizar esascuentas en segundos. Con la potencia computacional actual, los métodos de cifrado clásico proveen poca protecciónreal para la privacidad de los mensajes.

Análisis de frecuencias 3

Enlaces externos• Herramientas gratuitas para analizar los textos: contar y analizar los personajes [1] y contar y analizar las sílabas

(bigrames y trigrames) [2]

• Las distribuciones de 20 idiomas: frecuencias de caracteres [3] y frecuencias de sílabas [4]

Referencias• Helen Fouché Gaines, "Cryptanalysis", 1939, Dover. ISBN 0-486-20097-3• Ibraham A. “Al-Kindi: The origins of cryptology: The Arab contributions”, Cryptologia, 16(2) (April 1992) pp.

97–126.• Abraham Sinkov, "Elementary Cryptanalysis : A Mathematical Approach", The Mathematical Association of

America, 1966. ISBN 0-88385-622-0.

Referencias[1] http:/ / www. sttmedia. com/ charactercounter[2] http:/ / www. sttmedia. com/ syllablecounter[3] http:/ / www. sttmedia. com/ characterfrequencies[4] http:/ / www. sttmedia. com/ syllablefrequencies

Fuentes y contribuyentes del artículo 4

Fuentes y contribuyentes del artículoAnálisis de frecuencias  Fuente: http://es.wikipedia.org/w/index.php?oldid=32368518  Contribuyentes: Dr Juzam, JunCTionS, Zahualli, 2 ediciones anónimas

Fuentes de imagen, Licencias y contribuyentesImagen:Merge-arrows_2.svg  Fuente: http://es.wikipedia.org/w/index.php?title=Archivo:Merge-arrows_2.svg  Licencia: Public Domain  Contribuyentes: User:DavidgothbergArchivo:English-slf.png  Fuente: http://es.wikipedia.org/w/index.php?title=Archivo:English-slf.png  Licencia: Public Domain  Contribuyentes: -Archivo:Frecuencia de uso de letras en español.PNG  Fuente: http://es.wikipedia.org/w/index.php?title=Archivo:Frecuencia_de_uso_de_letras_en_español.PNG  Licencia: GNU FreeDocumentation License  Contribuyentes: Original uploader was Tico at es.wikipediaArchivo:Al-kindi-cryptanalysis.png  Fuente: http://es.wikipedia.org/w/index.php?title=Archivo:Al-kindi-cryptanalysis.png  Licencia: Public Domain  Contribuyentes: -

LicenciaCreative Commons Attribution-Share Alike 3.0 Unportedhttp:/ / creativecommons. org/ licenses/ by-sa/ 3. 0/