Predicción temprana de tendencias en redes sociales basada en características sociales y contenido

12 Mayo 2021 - Google Meet | UNC Estudiantes

Defensa de Trabajo Especial de la Licenciatura en Ciencias de la Computación | Emanuel Juan René MERILES

Directores: Dr. Martín Ariel Domínguez - Lic. Pablo Gabriel Celayes

Fecha: miércoles 12 de mayo de 2021

Hora: 10:00 hs

Lugar: https://meet.google.com/mbh-gqcc-jzz

Resumen: En estos últimos años, las redes sociales se han hecho cada vez más masivas. En consecuencia, son una fuente fundamental de información y una poderosa herramienta para esparcir ideas y opiniones. Basándose en Twitter, este trabajo estudia el problema de predecir las preferencias de retweeteo de un usuario, dado un tweet, considerando cómo el tweet ha sido compartido por el ambiente de ese usuario; y además el problema más global de predecir si un tweet va a ser popular o no, basado en el comportamiento de retweeteo de usuarios centrales. Para ambos problemas exploramos la evolución de la calidad de la predicción, dependiendo de la cantidad de información disponible en el tiempo desde que un tweet es creado, y elaborar conclusiones sobre el trade-o entre el tiempo transcurrido y la performance de la predicción. Para el problema de predicción de un usuario, este modelo social de predicción logra, por ejemplo, alrededor de 63,76 % en score F1 usando los primeros 15 minutos de información, 75,2 % a las 4 horas, y 86,08 % sin considerar ninguna ventana de tiempo. En el caso de la predicción de popularidad, conseguimos scores de 65,67 % con 60 minutos de información, 74,4 % con 4 horas y 80,73 % sin la restricción de ventanas de tiempo, usando el comportamiento del 15 % de los usuarios considerados inuencers. Todos estos resultados son obtenidos sin considerar el contenido de los tweets. Luego incorporamos features basadas en los word embeddings de FastText para representar el contenido de los tweets. Mientras estos modelos por sí solos obtienen un F1 de alrededor del 50 % para preferencias y predicción de popularidad, cuando se combinan con modelos sociales se mejora la predicción de popularidad, en la mayoría de los casos, en más de un 4 %. Para el caso de predicción de preferencia, la incorporación de FastText al modelo social es más útil para pequeñas ventanas de tiempo. Concluimos que es posible predecir razonablemente la preferencia de retweeteo de un usuario o cuán popular va a ser una publicación, usando sólo la información disponible dentro de los primeros 30-60 minutos.