Como parte de Cultural Sentiment planteamos la necesidad de introducir aplicaciones de las técnicas de minería de opinión que puedan resultar útiles desde otros puntos de vista. La idea básica en un análisis de sentimientos basado en el empleo de léxicos es que la aparición de ciertas palabras también es probable que induzca emociones en las personas que leen los textos. Teniendo esto en cuenta hemos realizado un trabajo de análisis de sentimientos sobre textos técnicos y descriptivos de varios elementos de patrimonio industrial español recogidos en el inventario del Plan Nacional de Patrimonio Industrial. Este trabajo se ha realizado con dos objetivos: el primero, determinar si las propias redacciones, a pesar de ser descriptivas, pueden inducir sentimientos positivos o negativos como resultado de una elección de palabras; el segundo, encontrar hasta qué punto incluso el propio análisis de sentimientos es capaz de identificar los elementos de patrimonio industrial en peligro en una situación crítica a partir de una descripción técnica. De modo que hemos realizado un trabajo de análisis de sentimientos sobre textos técnicos o descriptivos de elementos de patrimonio industrial español recogidos en el inventario del Plan Nacional de Patrimonio Industrial. Para ello tomamos las fichas de diferentes elementos de patrimonio creadas por el IPCE a través de un mapa interactivo.
El resultado obtenido del análisis se presenta para cada elemento mostrando la presencia del sentimiento positivo y negativo a través de la polaridad emocional, además del peso estadístico de ocho emociones básicas. Para una visualización intuitiva y sencilla de los datos se optó por la creación de un mapa en formato PDF interactivo con fichas asociadas, para su publicación a través de la web. La elección de este formato deriva de que en un único documento se puede incluir un mapa con los elementos analizados y fichas que presenten las gráficas y la información textual y numérica más relevante. Con una estructura unificada o tabuladas lo que permita por su parte una mejor interpretación por parte de la comunidad científica o el minado de la información del propio documento, sea esta gráfica o textual. La intención es facilitar la consulta por parte de los investigadores y profesionales vinculados con el patrimonio industrial.
El formato de las fichas se ha diseñado para permitir la escalabilidad del análisis y poder añadir nuevos elementos. En las fichas se muestran las distribuciones de sentimientos y emociones de los textos obtenidas por la aplicación el Emolex de Mohammad and Turney (2013). Mediante la combinación de los valores de sentimientos positivos y negativos se muestra un valor de la polaridad emocional, entre los valores de -1.0 y 1.0, correspondientes a la máxima negatividad y positividad, respectivamente. El signo se representa gráficamente mediante la introducción de un código de colores. Para completar la información se introducen tres métricas adicionales más que hacen referencia a la comparación de los perfiles de sentimientos con los obtenidos mediante un análisis de la opinión en redes sociales, en concreto la distancia euclídea de cada distribución con la obtenida del valor medio del análisis de comentarios en Twitter, y un índice de complejidad léxica de los textos. Estas variables aportan información cuantitativa adicional para el análisis de su correlación con la polaridad emocional que se deduce de los textos. Estas son las siguientes:
Referencias:
Mohammad, S., Turney, P. (2013). «Crowdsourcing a Word-Emotion Association Lexicon». Computational Intelligence 29 (3), 436-465.
Proyecto financiado con las ayudas para la modernización e innovación de las industrias culturales y creativas
correspondientes al año 2022 del Ministerio de Cultura y Deporte.