Clipboard01.jpg
Noticias
29/08/2023

El mapa del sentimiento del patrimonio industrial español

Como parte de Cultural Sentiment planteamos la necesidad de introducir aplicaciones de las técnicas de minería de opinión que puedan resultar útiles desde otros puntos de vista. La idea básica en un análisis de sentimientos basado en el empleo de léxicos es que la aparición de ciertas palabras también es probable que induzca emociones en las personas que leen los textos. Teniendo esto en cuenta hemos realizado un trabajo de análisis de sentimientos sobre textos técnicos y descriptivos de varios elementos de patrimonio industrial español recogidos en el inventario del Plan Nacional de Patrimonio Industrial. Este trabajo se ha realizado con dos objetivos: el primero, determinar si las propias redacciones, a pesar de ser descriptivas, pueden inducir sentimientos positivos o negativos como resultado de una elección de palabras; el segundo, encontrar hasta qué punto incluso el propio análisis de sentimientos es capaz de identificar los elementos de patrimonio industrial en peligro en una situación crítica a partir de una descripción técnica. De modo que hemos realizado un trabajo de análisis de sentimientos sobre textos técnicos o descriptivos de elementos de patrimonio industrial español recogidos en el inventario del Plan Nacional de Patrimonio Industrial. Para ello tomamos las fichas de diferentes elementos de patrimonio creadas por el IPCE a través de un mapa interactivo


El resultado obtenido del análisis se presenta para cada elemento mostrando la presencia del sentimiento positivo y negativo a través de la polaridad emocional, además del peso estadístico de ocho emociones básicas. Para una visualización intuitiva y sencilla de los datos se optó por la creación de un mapa en formato PDF interactivo con fichas asociadas, para su publicación a través de la web. La elección de este formato deriva de que en un único documento se puede incluir un mapa con los elementos analizados y fichas que presenten las gráficas y la información textual y numérica más relevante. Con una estructura unificada o tabuladas lo que permita por su parte una mejor interpretación por parte de la comunidad científica o el minado de la información del propio documento, sea esta gráfica o textual. La intención es facilitar la consulta por parte de los investigadores y profesionales vinculados con el patrimonio industrial.


El formato de las fichas se ha diseñado para permitir la escalabilidad del análisis y poder añadir nuevos elementos. En las fichas se muestran las distribuciones de sentimientos y emociones de los textos obtenidas por la aplicación el Emolex de Mohammad and Turney (2013). Mediante la combinación de los valores de sentimientos positivos y negativos se muestra un valor de la polaridad emocional, entre los valores de -1.0 y 1.0, correspondientes a la máxima negatividad y positividad, respectivamente. El signo se representa gráficamente mediante la introducción de un código de colores. Para completar la información se introducen tres métricas adicionales más que hacen referencia a la comparación de los perfiles de sentimientos con los obtenidos mediante un análisis de la opinión en redes sociales, en concreto la distancia euclídea de cada distribución con la obtenida del valor medio del análisis de comentarios en Twitter,  y un índice de complejidad léxica de los textos. Estas variables aportan información cuantitativa adicional para el análisis de su correlación con la polaridad emocional que se deduce de los textos. Estas son las siguientes:


  • dsent:  Distancia euclidiana entre el vector de sentimientos del texto y el valor promedio obtenido a partir del análisis de comentarios en Twitter en el periodo de un año.
  • demot:  Distancia euclidiana entre el vector de emociones del texto y el valor promedio obtenido a partir del análisis de comentarios en Twitter en el periodo de un año.
  • MATTR: Índice del cociente types/tokens del texto. Como las fichas tienen una extensión en orden de magnitud similar se espera que este indicador aporte una medida aproximada del grado de complejidad léxica. En cualquier caso se ha optado por el procedimiento de cálculo Covington and McFal (2010) para reducir el impacto del tamaño de los textos analizados.
En definitiva, este mapa constituye una base para la aplicación de las técnicas de minería de opinión en la mejora de los contenidos técnicos, académicos y divulgativos referentes al patrimonio industrial español. Por lo que se trata de una herramienta puesta a disposición de la comunidad académica y de los organismos de gestión del patrimonio.

Referencias:


Covington, M., McFall, J.D. (2010). «Cutting the Gordian knot: the moving-average type-token ratio (MATTR)». Journal of Quantitative Linguistics 17, 94–100.

Mohammad, S., Turney, P. (2013). «Crowdsourcing a Word-Emotion Association Lexicon». Computational Intelligence 29 (3), 436-465.

Proyecto financiado con las ayudas para la modernización e innovación de las industrias culturales y creativas
correspondientes al año 2022 del Ministerio de Cultura y Deporte.

ministerio de cultura y deporte
Ir arriba