pexels-miguel-á-padriñán-3785932.jpg
Noticias
30/08/2023

Sentimiento industrial

Como parte de Cultural sentiment una de las acciones realizadas ha sido el análisis de sentimientos de los relatos presentados en los concursos que organiza la asociación INCUNA en el marco de sus Jornadas Internacionales de Patrimonio industrial. Esta clase de fuentes textuales son muy interesantes ya que por su naturaleza permiten obtener información más completa y detallada de la percepción sobre el patrimonio industrial de las personas participantes. Ya sean relatos basados en experiencias reales o completamente inventados reflejan el contexto emocional y simbólico que el patrimonio industrial tiene para sus autores. En este caso la extensión de los textos favorece el análisis ya que presentan un número de palabras suficiente para obtener estadísticas significativas sobre cada texto a la vez que tampoco su extensión es demasiado elevada como para presentar un exceso de información en lo que respecta a los sentimientos. Aquí no se trata de analizar la evolución del sentimiento en el texto sino de procesar el conjunto agregado de todos los relatos.


Para realizar el análisis se consideraron un conjunto de algo más de 100 relatos presentados a varias ediciones de este concurso. Esto permite obtener una muestra significativa en lo que respecta a analizar aspectos como la frecuencia de palabras en el contexto de todos los documentos. La tipología de los relatos implica que se deben utilizar métricas de la frecuencia ponderadas. Por ejemplo, la presencia de nombres propios puede ser constante en algunos de los relatos presentando una elevada frecuencia en el documento que genere una frecuencia en el conjunto global elevada. Lo mismo puede suceder con algunos términos técnicos o lugares, es algo que se observa en algunos de los relatos y se ha tenido en cuenta. En el primer caso, se podría optar por eliminar los nombres propios pero esto también puede inducir un sesgo ya que la presencia de familias de estos puede ser indicativa de algún patrón. En el segundo, los propios términos que se repiten pueden ser en sí mismo la clave del análisis. Por esta razón para construir las nubes de palabras se empleo la métrica TF-IDF que tiene en cuenta la frecuencia del término pero también el número de documentos en que aparece. Uno de los resultados principales que se obtiene es la nube de palabras, que es la que se muestra en la figura.


Lo más significativo es que una buena parte de los términos que aparecen con más frecuencia hacen relación a la familia de lo que se deduce que en los relatos la conexión con el patrimonio industrial es importante. También en lo que se refiere a los vinculados con la actividad es importante destacar que hacen referencia al patrimonio material, es decir, a los lugares de trabajo, lo que resulta consistente teniendo en cuenta que se establece esa conexión con el padre, el abuelo, etc. Las palabras con más peso son abuelo y fábrica. Nos parece muy interesante el hecho de la referencia a la maquinaria y que aparece tanto como máquina y máquinas. En este caso el no utilizar un lematizado de las palabras aporta información significativa. La diferenciación entre singular y plural es muy importante tanto por el contexto literario que hayan querido introducir sus autores en los relatos como en la referencia a diferentes tipos de experiencia de los trabajadores. Más específica, más genérica, o en función del tipo de trabajo.


Pero, ¿cuáles son los sentimientos asociados con los textos? En la siguiente figura se muestran las frecuencias relativas de los sentimientos positivos frente a los negativos. Para los cálculos de los porcentajes de sentimientos y emociones se empleo la versión en español del Emolex de Mohammad y Turney (2013).


Lo primero que se observa es que el peso estadístico global de palabras asociadas con un sentimiento es significativo. Lo textos poseen una importante carga sentimental, sea en el sentido que sea. Además, la contribución de los términos positivos y negativos es muy similar, con un ligero sesgo de los positivos. Teniendo en cuenta lo que se observa en la nube de palabras esto se puede explicar como un sentimiento neutro por un balance entre los positivo y lo negativo en los relatos o bien como resultado de diferentes cargas emocionales en los relatos. Por esta razón también realizamos un análisis de la polaridad de cada relato. Esta variable la hemos calculado como un valor en el intervalo [-1, 1] de modo que se calcula, a partir de las frecuencias relativas:


Polaridad Positivos + (-1) * Negativos


De este modo la máxima negatividad se obtiene con -1 y la positividad con +1, respectivamente. Para visualizar el conjunto de los relatos se presenta un histograma de valores de la polaridad para cada relato.


Se observa una distribución ligeramente asimétrica desviada hacia la zona de los valores positivos pero aún así los valores próximos a cero dominan significativamente el conjunto. En las colas no se observan valores extremos, esto es de esperar en textos largos y complejos como los analizados, frente a lo que veremos con respecto al caso de las redes sociales. Pero incluso así los valores intermedios en el rango de polaridad tienen una contribución escasa, y la cola más desarrollada se encuentra precisamente en el caso de los positivos. Esto muestra que en los relatos se encuentra una balance muy ponderado de los sentimientos, hay una ambivalencia en la interpretación del patrimonio industrial por parte de los autores, que posiblemente se asocia con diferentes percepciones de cada uno de los términos. Esto requiere de un análisis utilizando términos clave como variables predictoras con un modelo de aprendizaje automático pero tal análisis lo presentaremos en otro momento. Las conclusiones que podemos sacar de este análisis son las siguientes:

  • En los relatos la presencia de los vínculos familiares es muy importante y la conexión con el patrimonio se realiza con respecto a los elementos materiales de las industrias frene a los inmateriales.
  • Hay una ambivalencia bastante clara en la mayor parte del conjunto de relatos entre la connotación positiva y negativa del patrimonio industrial que se manifiesta en un dominio de la polaridad emocional neutra.


Referencias:


Mohammad, S., Turney, P. (2013). «Crowdsourcing a Word-Emotion Association Lexicon». Computational Intelligence 29 (3), 436-465.

Proyecto financiado con las ayudas para la modernización e innovación de las industrias culturales y creativas
correspondientes al año 2022 del Ministerio de Cultura y Deporte.

ministerio de cultura y deporte
Ir arriba