Defensa de Tesis para optar al grado de doctor en Ciencias de la Computación | Lic.Matías Daniel Molina
Director: Dr. Jorge Adrián SÁNCHEZ (FAMAF – UNC)
Tribunal Especial:
Dra. María Elena BUEMI (FCEN - UBA)
Dr. Martín Ariel DOMÍNGUEZ (FAMAF - UNC)
Dra. Valeria Soledad RULLONI (FCEFyN – UNC)
Lugar: enlace de meet
Resumen: La tarea de clasificación de imágenes es uno de los problemas de mayor estudio en las áreas de aprendizaje automático y visión por computadoras, la cual consiste en asignar etiquetas a las imágenes que describan su contenido a nivel semántico, por ejemplo, los objetos presentes en la escena. Este problema se aborda, por lo general, mediante técnicas de aprendizaje supervisado. Es decir, se utiliza un conjunto de imágenes etiquetadas como base sobre el cual entrenar modelos con el fin de reconocer patrones generales. En este escenario, el conjunto de categorías se define a priori y el objetivo es poder identificar las categorías que puedan ser asignadas a una nueva imagen dada. En los últimos años, este problema ha sido resuelto de manera exitosa debido, por un lado, al uso de modelos complejos y gran cantidad de datos etiquetados y, por el otro, al crecimiento en las capacidades de cómputo necesarias para su entrenamiento. Un aspecto relevante sobre los conjuntos de entrenamiento, es que suelen presentar lo que se conoce como fenómeno de cola larga. Esto es, muchas instancias para un conjunto reducido de categorías pero pocas instancias para un gran número de categorías. A su vez, recolectar y anotar suficiente cantidad de imágenes implica un costo significativo. Por otro lado, los clasificadores supervisados solo son de utilidad para consultar imágenes de las categorías con las que han sido entrenados, pero no así para categorías no contempladas en los conjuntos de entrenamiento. Poder abordar estas limitaciones ha motivado nuevos paradigmas de aprendizaje como el aprendizaje con pocos ejemplos o el aprendizaje sin ejemplos (zero-shot learning, por su denominación en inglés). En este último caso, el objetivo es aprender a clasificar objetos nunca vistos durante la fase de entrenamiento. En esta tesis se explora este paradigma de aprendizaje aplicado al problema de clasificación de imágenes naturales. El presente trabajo se basa principalmente en el estudio, identificación de problemas y propuestas que permiten el análisis de diferentes aspectos propios de la tarea, tanto para las metodologías de clasificación como para los protocolos de evaluación. Se contribuye así a la identificación y estudio de diferentes fenómenos intrínsecos a la tarea de clasificación sin ejemplos.