¿Qué es un análisis de sentimientos?
El análisis de sentimientos en Twitter (actualmente X) es una técnica que nos posibilita identificar y analizar el “tono emocional” de las opiniones de las personas en esta red social, para aproximarnos a medir si estas respuestas emocionales son positivas, negativas o neutras en el texto de un tuit. Es muy usado por empresas para conocer las experiencias de los clientes, analizar sus comentarios respecto a una marca, reseñas productos o servicios, conocer su reputación y a partir de allí tomar decisiones, mejorar o crear nuevas estrategias de marketing.
Desde Ewe decidimos hacer un análisis de sentimientos a los tuits sobre Infancias Afrodescendientes, con el objetivo de explorar qué se comenta en Twitter (X), cuáles son las opiniones mas frecuentes y cómo es el tono del contenido que se genera alrededor de este tema.
¿Cómo hicimos el análisis de sentimientos sobre Infancias Afrodescendientes en Twitter (X)?:
Inicialmente se realizó la descarga de tweets con el complemento de Google drive Tweet Archiver usando la ecuación de búsqueda: afro OR infancia OR afrodescendiente #afro OR #infanciaafro OR #infancia OR #afroinfancia lang:es -f.
Se descargaron 151 tweets de 4/03/2023 22:42:09 a 7/03/2023 16:30:03
Se eliminaron 17 repetidos quedaron 134 registros
Luego se realiza una clasificación de la información de los tweets. Para este ejercicio se hizo una clasificación de texto de forma manual leyendo cada uno de los tweets y clasificándolos en -1 si es negativo, 1 si es positivo.
El siguiente paso fue una segunda depuración quitando los tweets no relevantes para el tema – quedaron 123 registros. Se cargó el archivo a R y se realizó una limpieza del archivo: se cambia todo a minúscula, se quitan signos de puntuación, se eliminan las stopwords (Se trata de aquellas palabras que al usarlas individualmente sin acompañar a las palabras claves del texto carecen de sentido). y los espacios y tabulaciones adicionales.
Después de esta limpieza quedan: 24 tweets negativos, 99 tweets positivos. En este caso las palabras que más se repiten se evidencian en la siguiente nube de palabras:

En este caso por la búsqueda realizada la palabra que más se repite es infancia y en segundo lugar afro. Sin embargo las demás palabras no muestran una tendencia en cuanto a un tema específico; son palabras en algunos casos sin sentido. Se destacan palabras como escolar, formación, oportunidad, educación, protección y adolescencia, palabras relacionadas con temas relevantes para el trabajo de EWE.
Luego se separan las palabras en columnas y se obtienen 181310 palabras diferentes y se eliminan las palabras que tienen menos frecuencia en los 123 tweets, en este caso quedan 1492 términos:
<<DocumentTermMatrix (documents: 123, terms: 1492)>>
Non-/sparse entries: 2206/181310
Sparsity: 99%
Maximal term length: 34
Weighting: term frequency (tf)
En este caso con esa matriz se separa el archivo en un set de entrenamiento (80%) y de prueba (20%)
Se realiza el entrenamiento del modelo pero el algoritmo realiza un truncamiento. Al generar la predicción arroja 25 tweets positivos, no arroja tweets negativos, lo cual no permite validar estadísticamente la coherencia del modelo. En este caso se deduce que se trata de la calidad de los datos iniciales.

¿Y estos resultados que significan para Ewe?
Realizar este análisis de sentimientos generó varias reflexiones:
Lo primero que hay que decir es que no se encontró un gran volumen de datos en relación con las “Infancias Afrodescendientes” (#infanciaafro #afroinfancias). Entonces repetimos el ejercicio, y el resultado fue el mismo. Nos preguntamos sí ¿se habla o no de los niños, niñas y adolescentes afrodescendientes en Twitter? Así que corrimos de nuevo la fórmula, más abierta con palabras relacionadas, pero no necesariamente juntas (#afro #infancias), seguimos cuentas relacionadas a los derechos de las infancias en diferentes países, en agencias de cooperación internacional, organizaciones gubernamentales, con la expectativa de encontrar mejores resultados… Muchos más tuis, pero que poca relación tenían con nuestro tema: hablaban de lo #afro, en relación con comunidades o temas del cabello, sin mención alguna sobre las infancias, o hablaban de las infancias, sin mencionar su pertenencia étnica, con y sin # (hashtag).
El truncamiento del algoritmo que conlleva a que no se pueda validar estadísticamente el modelo, en términos cualitativos dice mucho en términos de la falta de datos y con ello, la invisibilidad del tema en Twitter, que en términos de análisis de contexto donde se comentan tantos temas políticos, sociales, culturales, tecnológicos, entre otras dimensiones que muchas veces se convierten en tendencia, da cuenta de que no se habla de las infancias afrodescendientes en Twitter, y ese resultado en sí mismo dice muchas cosas.
Valorar el tono emocional resulta aún más complejo en tanto las valoraciones positivas de los tuits analizados no corresponden de manera específica a las infancias afrodescendientes, sino a las infancias de manera general, un universo en el que lo étnico-racial aún resulta etéreo. Pero no podemos olvidar que el algoritmo es alimentado por humanos, por tanto:
- ¿Cómo cambiamos la presencia de este tema en la agenda de nuestras interacciones digitales en las redes sociales, que posibilite a dar eco a las realidades que viven los niños, niñas y adolescentes afrodescendientes en América Latina y el Caribe?
- ¿Cuál es el impacto en la vida presencial de nuestras interacciones virtuales en relación con las problemáticas, realidades y propuestas en torno a las infancias afrodescendientes?
- ¿Quiénes y que tipo de información consumimos y generamos para visibilizar dichas realidades?
Compártenos tu opinión en los comentarios y comenta también en nuestro Twitter (X).





