Una de las fuentes más interesante para la obtención de muestreos de población amplios y representativos son las redes sociales. Por esta razón también hemos realizado un análisis de sentimientos sobre el patrimonio industrial. Este nos ha servido para realizar una investigación cuyos resultados más generales presentamos aquí públicamente. Pero también para elaborar estrategias y productos que explotaremos más adelante en torno al patrimonio industrial. A diferencia del caso del análisis de microrrelatos aquí el formato de las redes sociales resulta determinante. En nuestro caso hemos optado por realizar una monitorización de la red X/Twitter durante un periodo de 16 meses hasta obtener un número de tweets superior a 4000. Los periodos temporales de muestreo y el número total de comentarios han estado limitados por los continuos cambios de política de la compañía. Pero en cualquier caso nos han servido para obtener una muestra amplia y representativa.
En este caso las métricas para el análisis de palabras son diferentes ya que los comentarios son breves y eso evita la redundancia indeseada de términos. Esto por otra parte también implica unos porcentajes de la presencia de sentimientos y emociones más restringidos, ya que el muestreo se hace sobre un número muy delimitado de caracteres. Esto implica que es posible obtener pesos estadísticos más altos de algunos sentimientos y emociones y como consecuencia valores extremos de la polaridad emocional. A este respecto se espera una mayor polarización, lo que es un hecho demostrado a partir de diversas investigaciones publicadas en la literatura científica. No nos corresponde especular aquí sobre las razones pero sí hay que tener esto en cuenta en el análisis. Otro hecho a tener en cuenta es que aquí vamos a tener una muestra con tipologías de comentarios diversas. Los habrá de tipo informativo, de promoción de museos o actividades, de comentarios políticos, de reseñas sobre elementos de patrimonio o denuncias sobre daños efectuados a elementos de interés. Esto también puede contribuir a las colas de los extremos en el histograma de la polaridad.
En lo que respecta a la nube de palabras en este caso hay que incluir también la distribución estadística de palabras clave o hashtags de modo que se pueda hacer un análisis comparado entre unos términos y otros. Esto permite determinar también el peso de los comentarios puramente promocionales ya que es algo que habría que observar en el caso de las etiquetas. En primer lugar la nube de palabras:
Intencionadamente hemos decidido no filtrar el término de búsqueda, ya que uno de los objetivos era determinar si la referencia a los términos patrimonio e industrial llevaba o no asociada la inclusión de algún tipo de etiqueta especifica. Algunos de las etiquetas se corresponden con campañas específicas de entidades o cuentas de la propia red social que están dedicadas en exclusividad a esta temática, lo que demuestra inequívocamente que hay una comunidad bastante activa que genera contenidos sobre patrimonio industrial. Un análisis de grano fino muestra que el peso importante de las referencias al Museo de la Energía es el resultado de una actividad intensa y efectiva de los responsables en redes de esta entidad que destaca frente a otras similares en lo que representa a su visualización en esta y otras redes sociales. Sin embargo la referencia geográfica completa no es tan determinante ya que las frecuencias para Ponferrada, donde se ubica dicho museo, y otras ciudades como Valencia son bastante similares
En cuanto al comportamiento de la polaridad aquí presentamos dos clases de análisis. Por una parte la muestra de la evolución temporal de esta con el agregado de todos los tweets generados en un intervalo de tiempo determinado y la distribución estadística de los tweets individuales. Para la evolución temporal hemos considerado la agregación de todos los comentarios correspondientes a un día. Cualquier noticia o acontecimiento vinculado con elementos de patrimonio industrial podría modificar la evolución promedio, por lo que la curva de evolución temporal nos puede indicar momentos importantes. De nuevo para los cálculos hemos utilizado el Emolex de Mohammad and Turney (2013).
Este es el resultado más importante de este análisis. Por una parte se muestra que la frecuencia de tweets polaridad positiva es bastante elevada. El pico en el valor de polaridad cero es lo esperado en la medida que lo más probable es que la mayoría de las palabras que podemos encontrar en los tweets van a ser neutras emocionalmente salvo cuando se introducen algunos con una carga emocional más clara, que son las que requieren un análisis específico. Aunque en frecuencia es casi una cuarta parte del máximo de positividad la frecuencia de tweets con máxima negatividad es significativa. A partir de estos resultados se extraen las siguientes conclusiones:
Referencias:.
Mohammad, S., Turney, P. (2013). «Crowdsourcing a Word-Emotion Association Lexicon». Computational Intelligence 29 (3), 436-465.
Proyecto financiado con las ayudas para la modernización e innovación de las industrias culturales y creativas
correspondientes al año 2022 del Ministerio de Cultura y Deporte.