Aná lisis de Correspondenciás Eurovisio n 2014
Javier Merino Mozo
Análisis de Correspondencias para los 10 primeros clasificados de Eurovisión 2014. Los
países que han votado han sido agrupados en zonas geográficas.
12-1-2015
Análisis de Correspondencias-Eurovisión Javier Merino Mozo Modelos Estadísticos Multivariantes 1 1
1. Descripción del problema El Festival de la Canción de Eurovisión es un concurso televisivo celebrado anualmente desde
1956 en el que países europeos seleccionan un cantante o grupo para que interprete una
canción. Los participantes interpretan dicha canción en una gran gala que se retrasmite a toda
Europa. Después de que todos los países hayan actuado (sólo los que estén en la final, pues
hay eliminatorias previas) la gente puede votar desde sus casas a su favorita (nunca pueden
votar a su país) y, en función de esos votos, los países se dan puntos unos a otros. Finalmente,
el país que más puntos recibe es el ganador. Cada año, la gala se realiza en el país ganador del
año anterior.
Los puntos que se otorgan en función de los votos son los siguientes (formato 2014, que es el
año que vamos a estudiar):
Posición Votos
1º 12 2º 10 3º 8 4º 7 5º 6 6º 5 7º 4 8º 3 9º 2
10º 1
Es por todos conocida la tendencia de la gente a decir que los países votan a ‘sus amigos’, es
decir, a los países vecinos o a países con los que han estado muy ligados en el pasado.
Obviamente, también al contrario, países que nunca se han llevado bien, o que han tenido
conflictos bélicos, etc. tienden a no votarse.
Mediante un Análisis de Correspondencias de los resultados del festival en 2014 vamos a
intentar averiguar, o por lo menos hacernos una idea, de si esto es cierto.
2. Datos Vamos a manejar las puntuaciones de los 10 primeros clasificados del año 2014 (festival
celebrado en Copenhague). En esta edición, votaron un total de 37 países. Cada uno de esos
países otorgó votos a sólo 10 países, por lo que si no realizamos una agrupación de los países
votantes la tabla de contingencia que obtenemos tendrá ceros en la mayoría de sus casillas,
hecho que no resulta apropiado en un análisis de este tipo.
2.1. Agrupación de países Tras varias pruebas en la división de los países en zonas geográficas, en las que por una u otra
razón el resultado no era óptimo (países muy lejanos en el mismo grupo, tabla de contingencia
con ‘casillas inapropiadas’, etc.), se decide que el número de grupos sea de 6, con 5 grupos de
6 países y un grupo de 7 países. Se ha intentado que los países dentro de un mismo grupo sean
lo más homogéneos posibles (zona geográfica, características del país) pero obviamente los
grupos no son perfectos porque es imposible encontrar una distribución geográfica totalmente
Análisis de Correspondencias-Eurovisión Javier Merino Mozo Modelos Estadísticos Multivariantes 2 2
apropiada. A continuación vemos un mapa de Europa, donde se han coloreado los países por
zona geográfica:
Por tanto, los 6 grupos de países son:
Nombre del grupo Países
Oeste de Europa Bélgica – España- Francia – Irlanda – Portugal
– Reino Unido
Este de Europa Armenia – Azerbaiyán – Bielorrusia – Georgia
– Moldavia – Ucrania
Centro de Europa Alemania – Dinamarca – Holanda – Hungría –
Lituania – Polonia
Sur de Europa Austria – Eslovenia – Italia – Malta – San
Marino – Suiza
Nórdicos Estonia – Finlandia – Islandia – Letonia –
Noruega – Rusia – Suecia
Balcanes Albania – Grecia – Israel – Macedonia –
Montenegro – Rumanía
*Nota: no todos los países comparten las características del nombre del grupo, pero el nombre define a la gran mayoría de ellos.
Análisis de Correspondencias-Eurovisión Javier Merino Mozo Modelos Estadísticos Multivariantes 3 3
2.2. Países entre los 10 primeros Como vemos en la tabla, en la final participaron
26 países. Nosotros utilizaremos los datos de los
diez primeros (de Austria a España) para realizar
el análisis de Correspondencias. La elección del
número de países a incluir en la muestra no ha
sido sencilla. Obviamente no ha sido por la
dificultad de incluir muchos países en la muestra
pues en la web se encuentran muy fácilmente, y
en tablas muy bien preparadas, las puntuaciones
de todos los países. Una de las bases de estos
análisis es que no haya modalidades (países en
este caso) con un número pequeño de
‘individuos’ en sus celdas. España, que es el 10º
país más votado ya presenta este problema,
pues, como veremos más adelante, presenta
casillas con muy pocos datos. Es probable que
algún país más pudiera haber entrado en la
muestra pues es probable que presentara un
buen número de individuos en sus casillas, pero
en algún momento hay que cortar esa entrada y
nos ha parecido una buena elección que fuese
en la 10ª posición.
Por tanto, con esta elección tanto de las modalidades de V1 (países que participan) como la de
V2 (grupos de países que votan) podemos realizar el Análisis de Correspondencias.
3. Tablas y gráficos Vemos una serie de tablas necesarias para la elaboración del análisis.
3.1. Tabla de contingencia A continuación vemos la tabla de contingencia que proporcionan estos datos mediante el
cruce de sus modalidades. Los países están ordenados por orden alfabético.
Oeste Este Centro Sur Nórdicos Balcanes TOTAL
Armenia 20 35 23 24 34 38 174
Austria 70 26 47 46 59 42 290
Dinamarca 20 1 16 10 23 4 74
España 19 4 7 12 11 21 74
Holanda 51 6 58 36 69 18 238
Hungría 16 20 7 15 32 53 143
Noruega 12 4 36 13 19 4 88
Rusia 2 54 6 5 3 19 89
Suecia 43 20 39 37 45 34 218
Ucrania 10 34 13 15 24 17 113
TOTAL 263 204 252 213 319 250 1501
País Puesto Puntos
Austria 1 290 Países Bajos 2 238
Suecia 3 218 Armenia 4 174 Hungría 5 143 Ucrania 6 113
Rusia 7 89 Noruega 8 88
Dinamarca 9 74 España 10 74
Finlandia 11 72 Rumanía 12 72
Suiza 13 64 Polonia 14 62 Islandia 15 58
Bielorrusia 16 43 Reino Unido 17 40
Alemania 18 39 Montenegro 19 37
Grecia 20 35 Italia 21 33
Azerbaiyán 22 33 Malta 23 32
San Marino 24 14 Eslovenia 25 9
Francia 26 2
Análisis de Correspondencias-Eurovisión Javier Merino Mozo Modelos Estadísticos Multivariantes 4 4
1501 votos fueros repartidos entre los 10 primeros, de los cuales 290 fueron a parar a Austria,
ganadora del certamen. El grupo de países que más votó a los 10 primeros fue el de los
Nórdicos, hecho que puede ser debido a que entre estos 10 primeros hay países tales como
Dinamarca, Noruega, Rusia o Suecia, esto es, países de ese perfil. Todas estas ‘conjeturas’ las
estudiaremos más adelante.
3.2. Tabla de frecuencias Dividimos cada una de las celdas entre el total de votos registrados y obtenemos la tabla de
frecuencias.
Oeste Este Centro Sur Nórdicos Balcanes TOTAL
Armenia 0,013 0,023 0,015 0,016 0,023 0,025 0,116
Austria 0,047 0,017 0,031 0,031 0,039 0,028 0,193
Dinamarca 0,013 0,001 0,011 0,007 0,015 0,003 0,049
España 0,013 0,003 0,005 0,008 0,007 0,014 0,049
Holanda 0,034 0,004 0,039 0,024 0,046 0,012 0,159
Hungría 0,011 0,013 0,005 0,010 0,021 0,035 0,095
Noruega 0,008 0,003 0,024 0,009 0,013 0,003 0,059
Rusia 0,001 0,036 0,004 0,003 0,002 0,013 0,059
Suecia 0,029 0,013 0,026 0,025 0,030 0,023 0,145
Ucrania 0,007 0,023 0,009 0,010 0,016 0,011 0,075
TOTAL 0,175 0,136 0,168 0,142 0,213 0,167 100
Si multiplicamos la fila y la columna de totales por 100 obtendremos los pesos de las
modalidades, que son indispensables a la hora de calcular distancias y proyecciones. Estos
pesos los veremos mejor en las siguientes tablas.
3.3. Perfiles fila Pasamos ahora al cálculo de los perfiles de las modalidades de V1, esto es, de los países que
participan en el concurso. Para construir estos perfiles debemos calcular, dentro de cada fila,
número de votos que le da cada grupo de países respecto al total de votos conseguidos por
ese país para hallar el porcentaje sobre la fila, de modo que esta sume el 100%. Es más sencillo
verlo en la tabla que entenderlo de forma teórica. Vemos la tabla de perfiles fila.
Oeste Este Centro Sur Nórdicos Balcanes PESO
Armenia 11,5 20,1 13,2 13,8 19,5 21,8 11,6
Austria 24,1 9,0 16,2 15,9 20,3 14,5 19,3
Dinamarca 27,0 1,4 21,6 13,5 31,1 5,4 4,9
España 25,7 5,4 9,5 16,2 14,9 28,4 4,9
Holanda 21,4 2,5 24,4 15,1 29,0 7,6 15,9
Hungría 11,2 14,0 4,9 10,5 22,4 37,1 9,5
Noruega 13,6 4,5 40,9 14,8 21,6 4,5 5,9
Rusia 2,2 60,7 6,7 5,6 3,4 21,3 5,9
Suecia 19,7 9,2 17,9 17,0 20,6 15,6 14,5
Ucrania 8,8 30,1 11,5 13,3 21,2 15,0 7,5
TOTAL 17,5 13,6 16,8 14,2 21,3 16,7 100
Suman 100
Análisis de Correspondencias-Eurovisión Javier Merino Mozo Modelos Estadísticos Multivariantes 5 5
En este caso el peso de cada fila es proporcional a los votos obtenidos.
Por realizar un ejemplo, de los pocos votos recibidos por Dinamarca (la que menos peso tiene
junto a España), el mayor porcentaje corresponde a los países Nórdicos, algo que se podía
prever.
Además de observar la tabla de perfiles fila vamos a visualizar un gráfico de los mismos, donde
representaremos en el eje de las X a los países que votan y en el eje de las Y los porcentajes de
los participantes, además del número medio de votos, que resulta muy útil para las
interpretaciones.
Es muy llamativo el hecho de que Austria (la ganadora) se encuentre más veces por debajo de
la media que por encima, 2 contra 4, lo que nos lleva a deducir que ganó más por la
regularidad que por la ‘amistad’ con otros países. Esto siempre ha sido así, pues aunque haya
países que tienen el voto seguro de sus vecinos al final el ganador del concurso es el país que
más gusta en general.
3.4. Perfiles columna De la misma forma que hemos procedido con los países participantes vamos a trabajar con los
grupos de países que votan. Ahora para cada columna tendremos el porcentaje de votos que
cada agrupación ha dado a cada país, y la suma de la columna será el 100%. Vemos la tabla de
perfiles columna.
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
Armenia
Austria
Dinamarca
España
Holanda
TOTAL
Hungría
Noruega
Rusia
Suecia
Ucrania
Análisis de Correspondencias-Eurovisión Javier Merino Mozo Modelos Estadísticos Multivariantes 6 6
Oeste Este Centro Sur Nórdicos Balcanes TOTAL
Armenia 7,6 17,2 9,1 11,3 10,7 15,2 11,6
Austria 26,6 12,7 18,7 21,6 18,5 16,8 19,3
Dinamarca 7,6 0,5 6,3 4,7 7,2 1,6 4,9
España 7,2 2,0 2,8 5,6 3,4 8,4 4,9
Holanda 19,4 2,9 23,0 16,9 21,6 7,2 15,9
Hungría 6,1 9,8 2,8 7,0 10,0 21,2 9,5
Noruega 4,6 2,0 14,3 6,1 6,0 1,6 5,9
Rusia 0,8 26,5 2,4 2,3 0,9 7,6 5,9
Suecia 16,3 9,8 15,5 17,4 14,1 13,6 14,5
Ucrania 3,8 16,7 5,2 7,0 7,5 6,8 7,5
PESO 17,5 13,6 16,8 14,2 21,3 16,7 100
El 16,7% de los votos de los países del este fueron a parar a Ucrania, por ejemplo. Esta serie de
países fue la agrupación que dio la menor cantidad de voto a los 10 primeros países, pues su
peso es el mínimo de los de la tabla. Los tres mayores porcentajes de votos de los países del
este corresponden a Armenia, Rusia y Ucrania, países muy cercanos tanto geográficamente
como culturalmente, reafirmando la teoría de los ‘países vecinos’.
Vemos a continuación la tabla de perfiles columna.
Destaca sobre todo el valor que presenta ‘Este de Europa’ en Rusia, pues es más del triple de
cualquier otro valor del país soviético. Por poner un ejemplo, los países del oeste de Europa
han votado más que la media a Suecia, pero como sabemos eso no significa que Suecia haya
sido el país más votado por esos países, y efectivamente comprobamos que el más votado ha
0,0
5,0
10,0
15,0
20,0
25,0
30,0
Oeste de Europa
Este de Europa
Centroeuropa
TOTAL
Sur de Europa
Nórdicos
Balcanes
Suman 100
Análisis de Correspondencias-Eurovisión Javier Merino Mozo Modelos Estadísticos Multivariantes 7 7
sido Austria. Las barras negras en este caso representan el porcentaje de voto que ha obtenido
cada país (de entre los votos de los 10 primeros).
4. Representación conjunta de los dos análisis Una vez descritos los datos ‘por separado’ procedemos al análisis conjunto de los mismos. Este
análisis será el que nos proporcione los resultados que tienen realmente interés en el entorno
en el que nos manejamos.
Para todo el análisis realizado a continuación se ha utilizado el programa estadístico SPAD,
pues proporciona herramientas muy útiles para el problema que tratamos.
4.1. Valores propios El primer paso a realizar en el análisis de correspondencias es la elección del número de ejes
que proporcionan un ajuste deseable. Obviamente sabemos que si cogiésemos todas las
direcciones posibles (5 en nuestro caso, pues recordamos que son p-1 las que recogen toda la
información) obtendríamos un análisis perfecto, pero eso no es lo que buscamos, ya que el
principal objetivo es la reducción de la dimensión. Nos quedaremos con aquellos ejes que
recogen más información de la esperada, en este caso un 20%.
En la tabla que tenemos a la derecha
podemos apreciar el valor propio de
cada eje (correspondiente a la matriz
𝑋𝑡𝑁𝑋𝑀, que es la que diagonalizamos),
así como el porcentaje de la
información que recogen. Si fuésemos
muy estrictos sólo nos quedaríamos con
el primer eje, pues sólo este supera el valor esperado, pero cómo podemos apreciar el eje nº 2
está muy en el límite, y pensamos que también ha de estar en el análisis. A la hora de realizar
caculos usamos todas las direcciones, pues son pocas y el ordenador no presentará problemas
computacionales.
4.2. Coordenadas y contribuciones A continuación vemos las tablas de coordenadas, contribución relativa y contribución absoluta
tanto de los perfiles fila como de los perfiles columna. Hemos reducido la visualización a los
dos primeros ejes porque no es viable escribir una tabla con más de 15 columnas.
Número Valor
propio Porcentaje
Porcentaje acumulado
1 0.1875 72.14 72.14
2 0.0518 19.92 92.06
3 0.0121 4.67 96.74
4 0.0069 2.65 99.39
5 0.0016 0.61 100.00
IDEN P.REL DISTO Coordenadas Cont. absoluta Cont. relativa
1 2 1 2 1 2
Oeste 17.52 0.14 0.31 0.07 9.0 1.6 0.68 0.03
Este 13.59 0.98 -0.96 -0.25 66.3 16.0 0.93 0.06
Centro 16.79 0.23 0.34 -0.30 10.1 29.4 0.50 0.40
Sur 14.19 0.04 0.15 0.01 1.7 0.0 0.65 0.01
Nórdicos 21.25 0.07 0.22 0.01 5.4 0.1 0.65 0.00
Balcanes 16.66 0.26 -0.29 0.41 7.5 52.9 0.32 0.63
Análisis de Correspondencias-Eurovisión Javier Merino Mozo Modelos Estadísticos Multivariantes 8 8
La calidad de representación no es mala, pues ningún grupo de países baja del 60%, pero
tampoco podemos hablar de valores excesivamente altos de la misma, pues sólo tres de las
seis agrupaciones superan el 90%. En cuanto a la determinación de los dos primeros ejes, son
los países del este los que se encargan del 1º y los países de los Balcanes del 2º, con más del
50% de la contribución absoluta cada uno.
IDEN P.REL DISTO Coordenadas Cont. Absoluta Cont. relativa
1 2 1 2 1 2
Austria 17.56 0.05 0.16 0.04 2.4 0.5 0.56 0.03
Holanda 14.41 0.21 0.43 -0.13 14.5 4.4 0.89 0.07
Suecia 13.20 0.02 0.14 0.02 1.3 0.1 0.76 0.02
Armenia 10.54 0.08 -0.26 0.05 3.8 0.5 0.87 0.03
Hungría 8.66 0.37 -0.29 0.50 3.9 41.2 0.23 0.67
Ucrania 6.84 0.26 -0.46 -0.16 7.7 3.6 0.81 0.10
Rusia 5.39 2.04 -1.38 -0.36 54.6 13.1 0.93 0.06
Noruega 5.33 0.50 0.44 -0.45 5.6 20.7 0.39 0.40
Dinamarca 4.48 0.30 0.50 -0.10 5.9 0.8 0.84 0.03
España 4.48 0.22 0.08 0.42 0.1 15.0 0.03 0.78
Salvo en el caso excepcional de Austria, cuya contribución relativa no supera al 60%, los demás
países presentan una contribución de este tipo no inferior a 0.8 (Noruega 0.79), lo que señala
una muy buena calidad de representación. En cuanto a la contribución absoluta vemos como
es Rusia la que determina en gran medida el primer eje factorial y Hungría ‘hace bastante’ por
determinar el 2º. Es Rusia el país más atípico en plano, con una gran diferencia sobre los
demás (distancia a origen).
4.3. Gráfico de los planos factoriales 1-2 Resulta mucho más sencillo ver la representación conjunta en el plano factorial 1-2.
Análisis de Correspondencias-Eurovisión Javier Merino Mozo Modelos Estadísticos Multivariantes 9 9
Viendo el gráfico apreciamos mucho mejor que
Rusia es un punto muy atípico que es posible
que desvirtúe un poco el análisis. Se aprecia
muy claramente cómo tanto el país soviético
como Ucrania presentarán valores más altos
que la media en las votaciones de los países
del este. También ocurre con, probablemente,
Armenia y Hungría (este último presenta
también valores más alto que la media en los
Balcanes), es decir, todos países muy cercanos
a esa zona. Efectivamente, observando los perfiles comprobamos esto que habíamos dicho. En
rojo vemos los países del este
Otro aspecto a destacar si
recorremos el eje 2 es la
puntuación que obtienen tanto
España como Hungría (ya lo
señalamos antes) en los países
de los Balcanes. Estas dos
naciones tendrán valores más
altos que la media de los demás
países en esa zona, hecho que
es fácil de entender en el caso magiar por su proximidad a ellos, pero que no tiene demasiada
lógica en el caso de España. Puede que sea un simple hecho casual pero podríamos pensar que
la gran tasa de inmigración de esos países al nuestro hayan provocado eso, aunque es una
simple conjetura. En amarillo vemos los países balcánicos.
En la parte más baja del plano
encontramos a Noruega, país nórdico
que presenta, según vemos, valores
más altos que la media en los países
el centro de Europa y valores más
bajos en los países del este. El hecho
de que obtenga esos valores para los
países del centro es bastante
probable que sea provocado por la
cercanía a ellos, y es más,
comprobando los datos, el único de
esos países que no otorgó puntos a
Noruega fue Hungría, el país más
alejado de esos 6. En cuanto a la baja puntuación en los países del este no parece que haya
una explicación lógica, pero tampoco tiene porqué haberla, simplemente puede ser casualidad
RUS
UCR
HUN
ARM
ESP
HUN
NOR
Análisis de Correspondencias-Eurovisión Javier Merino Mozo Modelos Estadísticos Multivariantes 10 10
pues no todo tiene que estar provocado por lejanías y cercanías. En verde vemos los países del
centro de Europa y en rojo los del este.
Podríamos seguir realizando comentarios sobre las características de los países en función de
su posición en el plano, pero apenas quedan elementos ‘extraños’ que estudiar. Referido a
esto, es curioso (aunque ya lo vimos en los perfiles) que Austria, la ganadora del certamen, no
presenta valores mucho más grandes que la media en ningún conjunto de países.
4.4. Gráfico de los planos factorial 1-2 con variables cuantitativas
ilustrativas En un primer momento planteamos la posibilidad de incluir ‘perfiles ilustrativos’ pero el hecho
de que no todos los años voten los mismos países hace que el análisis se distorsione, y por
tanto decidimos no incluirlos.
Sí incluimos variables cuantitativas de los países para comprobar si estas pueden explicar algo
acerca del análisis. Las variables que decidimos incluir son el ‘PIB per cápita’ y ‘nº de países
frontera’ (sólo se incluyen los países frontera con derecho a voto). Las características
numéricas de estas dos variables en los países son:
Austria Holanda Suecia Armenia Hungría Ucrania Rusia Noruega Dinamarca España
PIB 48479 47842 57948 3123 12933 40443 14246 99665 57572 30150
Frontera 5 2 2 2 4 6 8 2 1 2
Estimar el número de países que hacen frontera no es tarea fácil, puesto que hay países cuya
frontera con otros es marítima. Nosotros hemos desechado esa posibilidad, y sólo nos hemos
centrado en las fronteras terrestres. El valor del PIB se coge de la estimación del Fondo
Monetario Internacional en el año 2012. Vemos el gráfico con estas variables y los perfiles:
Análisis de Correspondencias-Eurovisión Javier Merino Mozo Modelos Estadísticos Multivariantes 11 11
Correlaciones
1 2 PIB 0.65 -0.5
Frontera -0.71 -0.12
El número de países frontera no parece producir un aumento de los votos. Por otro lado,
vemos como los países más desarrollados se encuentran en la parte baja y derecha del plano
(Noruega, Dinamarca, etc.). Lógicamente, los países de los Balcanes y del este son los que peor
PIB per cápita presentan, siendo los del centro de Europa, como se preveía a priori, lo que
mayor desarrollo alcanzan.
5. Conclusiones Como conclusión principal y más importante encontramos la presencia, pero no elemento
decisivo, del factor ‘vecino’. Hemos visto su presencia sobre todo en los países del este, con
Rusia como principal aval, pero en ese mismo país hemos comprobado que no vale con los
votos cercanos para ganar el certamen. Viendo los votos obtenidos por Austria nos damos
cuenta de que para ganar el festival hay que gustar a todo el mundo, y no es necesario gustar
mucho a nadie en particular. No obstante, para cerciorarnos de este hecho deberíamos
realizar el estudio durante todos los años que se ha celebrado Eurovisión, pues, por puro azar,
a lo mejor este año no se ha dado esta circunstancia, o a lo mejor se ha dado más de la cuenta
y otros años es menos importante estar rodeado de países de ‘voto seguro’.
Otra conclusión que podemos sacar es que la información contenida en estos certámenes (por
lo menos en el año 2014) se resume de manera muy simple, pues con 2 ejes recogemos más
del 90% de la información.
Por último, señalar que, salvo Rusia en los perfiles fila y Este de Europa en los perfiles columna,
no tenemos una gran heterogeneidad de perfiles.
Conclusión final: hay ‘efecto vecino’, pero no es determinante.