7 min read

Los discursos de les presidentes

(Juan Pablo Ruiz Nicolini, Iván Lewin y Camila Higa1)

Todos los 1 de marzo, ambas Cámaras del Congreso se reúnen para dar comienzo al año legislativo y cada año el presidente de turno encabeza el acto de Apertura. Los discursos2 suelen girar en torno a los ejes de gobierno, las promesas y los objetivos del año, pero más allá del contenido, cada uno tiene un estilo personal marcado por el presidente. Entender qué dicen y cómo lo dicen nos motivó a hacer un análisis sobre los 37 discursos desde el retorno de la Democracia.

Duración de los discursos a través del tiempo

Los años pasan y los discursos cambian. No solo varía qué se dice, sino también cuánto se dice. A través de una serie de tiempo, es posible observar cómo cambia la duración del discurso de año a año. Para una mejor visualización, se le asignó a cada presidente un color y se abreviaron los nombres a sus iniciales3.

El promedio de cantidad de palabras utilizadas por discurso fue de 9880. Sin embargo, se observan diferencias marcadas entre presidentes. CSM, FDR, ED y MM se mantuvieron siempre muy por debajo del promedio, mientras que NK y CFK se mantuvieron cerca o lo superaron.

Con 2846 palabras, el discurso de CSM en 1996 fue el más corto, mientras que con 26189 palabras en 2013, CFK se lleva el récord del más largo (más del doble que el promedio). Incluso, en ésta última, se observa una tendencia creciente a través de los años (excepto en 2014). Por último, el discurso de este año encabezado por AF tuvo la misma duración que el promedio, más largo que que los de su antecesor, pero aún por debajo del promedio de los de NK y CFK.


Cuáles son las palabras qué más repiten les presidentes fue una de las primeras preguntas que comenzamos a hacernos. Una forma gráfica de explorarlo es a través de una nube de palabras comparativa en la que los términos que más veces se mencionan tienen mayor centralidad y son de mayor tamaño.

En general, los términos más frecuentes suelen marcar cuáles son los ejes más importantes del discurso. Por ejemplo, la palabra que más resalta en RA es “democracia”. En el discurso de este año se destacan mayormente “desarrollo”, “deuda” y “federal”. Pero también aparecen palabras vinculadas a la cuestión de género que no aparecen frecuentemente en los discursos de sus antecesores: “La situación de las mujeres gestantes en Argentina presenta aspectos diversos. Distintos son los desafíos que enfrenta la mujer que desea tener a su hijo de aquellas que asumen que deciden interrumpir su embarazo. Un Estado que cuida debe acompañar a todas las mujeres para que esos procesos se desarrollen accediendo plenamente al sistema de salud.”

Frecuencia de palabras

En el siguiente gráfico se pueden comparar las palabras más repetidas por les presidentes excluyendo palabras muy frecuentes como artículos, preposiciones y otras.

Otro punto interesante para analizar es entender cuáles son las palabras que son importantes en cada discurso. ¿Cómo hicimos esto? A través del cálculo de TF-IDF (term frequency-inverse term frequency) que consiste en otorgarle menos peso a aquellas palabras que son muy comunes y darle más peso a aquellas que son menos usadas a lo largo de todos los discursos.

Entonces, a través de estos gráficos podemos ver qué palabras se destacan en cada uno de los discursos. Por ejemplo, en el de AF se destaca “sostenible” y aparecen entre las destacadas “género” y “embarazo”, mientras que, en los discursos de MM, las palabras varían pero en los últimos tres años, entre las palabras más destacadas aparece alguna relacionada a obras (“cloacas”, “parques”, “puentes”).

Decidimos hacer el mismo ejercicio, pero esta vez con bigramas (frecuencia de dos palabras consecutivas). En el gráfico de abajo se pueden visualizar los bigramas más frecuentes por discurso:

El contexto cambia año a año y los discursos también. Los bigramas más frecuentes no suelen repetirse ni siquiera a lo largo de un mismo período presidencial. Claro que hay algunas excepciones, por ejemplo, en los cuatro discursos de NK aparece “derechos humanos” entre el top 5 de bigramas: “Un país con memoria, verdad y justicia tiene que comprometerse profundamente con la defensa de los derechos del hombre (…). Desde un punto al otro del espectro ideológico, la defensa de los derechos humanos debe constituir un compromiso nacional y racional.”(2004)

En el gráfico de abajo se pueden observar los bigramas calculados con TF-IDF:

Semejanzas y diferencias

Ya dijimos que cada presidente elige sus palabras y tiene su estilo, pero nos propusimos ver qué tanto se acercan los discursos entre sí. Para esto realizamos un Análisis de Componentes Principales (PCA)4. La idea es que mediante esta técnica estadística, considerando la frecuencia de palabras, se puede ubicar cada uno de los discursos en un plano de acuerdo al contenido de los mismos.

Algunas observaciones preliminares del gráfico en relación a los discursos:

• En general, los discursos por presidente se encuentran cercanos entre sí (a excepción del de 1998 de CSM y de los de FDR y ED).

• Los de MM y de CFK se encuentran alejados del resto.

• Los de los primeros dos años y de los dos últimos de MM fueron mucho más cercanos entre sí.

• El de AF se posiciona más cerca de los de NK y, por lo tanto, alejado de sus antecesores inmediatos.


Al explorar los datos, tanto a través de las frecuencias de palabras como del modelado de tópicos, dos grandes ejes parecen ser capaces de englobar la mayoría de los términos expresados en los discursos. Dada esta intuición e inspirados en un estudio de la Universidad de Berkeley5 tomamos los primeros discursos de cada uno de los mandatos presidenciales para clasificar las palabras más frecuentes en cada una de estas categorías o “tópicos”.

Si ponemos el foco sobre los términos de política utilizados más frecuentemente (representado por el tamaño de las etiquetas del lado derecho) se destacan “justicia”, “nación” y “pueblo” por sobre “libertad”, “derecho” y “diálogo”. Y al analizar las palabras relacionadas al eje economía resaltan “crecimiento” y “desarrollo” por sobre el resto.

Otra manera de visualizar la información puede ser observar la frecuencia con que los distintos discursos utilizaron alguno de los términos de cada tópico. Ello está representado por el ancho de los flujos de colores. Así, por ejemplo, se observa que las intervenciones en el primer discurso de MM se restringen solo a tres de los términos: “derecho”, “diálogo” y “justicia” en el tópico política. O que las palabras más frecuentes de AF en el que refiere a economía fueron “deuda” y “desarrollo”.

Por último, calculamos que porcentaje del discurso representa la sumatoria de las palabras de cada uno de los ejes (representados en los círculos que refieren a cada uno de ellos). Así, por ejemplo, se observa que los primeros discursos de FDR Y CSM fueron los que usaron más frecuentemente palabras vinculadas a política como proporción de sus intervenciones, mientras que el de MM fue el que tuvo la menor cantidad de palabras vinculadas a este tópico. Por otro lado, éste último es el que utilizó proporcionalmente más veces palabras relacionadas a economía, mientras que CSM fue el que menos las utilizó.

(Todas las visualizaciones pueden descargarse de este repositorio)


(Nota: A partir del 24 de mayo de 2020 pueden encontrarnos en https://tuqmanor.netlify.app/)


  1. Publicado originalmente en https://mentacomunicacion.github.io/

  2. Los discursos fueron compilados por Antonio Milanese a partir de lo publicado en la HCDN.

  3. RA = Raúl Alfonsín, CSM = Carlos Saúl Menem, FDR = Fernando de la Rúa, ED = Eduardo Duhalde, NK = Néstor Kirchner, CFK= Cristina Fernández de Kirchner, MM = Mauricio Macri, AF = Alberto Fernández

  4. Un resultado similar obtuvimos al modelar los tópicos contenidos en los discursos. Preferimos mostrar esta distribución en un plano de dos dimensiones en funcion del PCA porque resulta visualmente más inteligible.

  5. https://datascience.berkeley.edu/blog/trump-state-of-the-union-analysis/