Un granadino aplica inteligencia artificial a las fichas escolares

Gustavo Rivas, en su despacho del Centro de Investigación Tecnologías de la Información y Comunicaciones (CITIC-UGR). /J. E. C.
Gustavo Rivas, en su despacho del Centro de Investigación Tecnologías de la Información y Comunicaciones (CITIC-UGR). / J. E. C.

Gustavo Rivas, investigador de la UGR, desarrolla una app capaz de describir objetos con lenguaje natural que se genera gracias a un modelo matemático

José E. Cabrero
JOSÉ E. CABREROGranada

Si tienen algún niño por casa seguro que lo visualizan rápidamente: una hoja repleta de figuras de distintos tamaños y colores. En el encabezado de la página, un reto: «Señala las figuras que sean iguales»; o «redondea los triángulos»; o «colorea los círculos de amarillo, los triángulos de rojo y los cuadrados de verde». ¿Lo tienen? Bien, ahora supongan que una máquina fuera capaz de entender una de esas hojas, explicarla y proponer retos. ¿Les parece sencillo? No lo es. Requiere un complejo proceso matemático que exige que la máquina sea capaz de hablar. Sí, de hablar. De expresarse como lo haría un ser humano. Y ese es el trabajo de un granadino.

Gustavo Rivas Gervilla (Granada, 1992) es doctorando en Informática con una beca de FPU (Formación de Profesorado Universitario). En su trabajo de fin de grado realizó un primer acercamiento al tema: procesamiento del lenguaje natural. «En este campo hay dos áreas, la comprensión del lenguaje natural –receptor– y la generación –emisor– . Yo estoy en la parte de generación, es decir, que un ordenador sea capaz de generar un texto similar al que haría un humano». Lo que intenta Rivas es que máquinas o sistemas como SIRI o Cortana se expresen como humanos y no como máquinas. «Y lo hago en un nicho muy concreto:la descripción de objetos o escenas».

Volvamos a la ficha infantil. Para conseguir que una máquina sea capaz de entender una imagen, supongamos una hoja con tres triángulos de distintos colores, el ordenador tiene que saber cuál es el color para explicarlo con un lenguaje natural. «Lo complicado es que el lenguaje natural es muy impreciso, no es blanco o negro, hay muchos grises. Ante un mismo color, habrá personas que vean rojo, otras rojo anaranjado y otras dirán que es naranja. Eso es la lógica difusa. Si la lógica normal se mueve entre el verdadero y el falso, el blanco y el negro, la difusa se mueve por los grises».

La app 'Refer4Learn'
La app 'Refer4Learn'

El trabajo de Gustavo Rivas se concreta en 'Refer4Learn', una app que genera imágenes aleatorias con figuras de tamaños y colores variados. «La máquina decide qué objeto va a referenciar y le añade una descripción», explica Rivas. Vamos a probarla:en la primera etapa, la imagen es muy sencilla, con sólo dos figuras, y la máquina nos pide que señalemos el círculo. Sin problema. Conforme avanzamos, nos pide que señalemos figuras por color («señala el cuadrado rojo», «señala el círculo azul»). Superada la fase, añade tamaños («señala el círculo mediano», «señala el círculo rojo grande»). Y, finalmente, añade una descripción de lugar («señala el círculo pequeño azul que está a la izquierda de un triángulo»). Esto es, efectivamente, un generador infinito de fichas escolares. «Parece algo muy tonto, pero por debajo tiene un modelo matemático de lógica difusa y grafos que hace que funcione esto».

Piensen que la máquina decide, en un suspiro, qué figura va a describir y cuál es el mejor método para hacerlo según el color, la ubicación, y el tamaño. «Si hay dos bolas rojas, el color no parece buena idea. Y si son todos iguales, no vale el tamaño», explica. Todo para conseguir que parezca lenguaje humano. Y eso tiene un futuro muy prometedor.

Futuro

«Ahora queremos trabajar con un pedagogo para seleccionar los colores que son capaces de distinguir los niños, cómo evolucionar los niveles de dificultad, qué estímulos debe tener la app... Y luego, llevar el sistema a los centros para ver cómo funciona con los niños». Pero el camino es mucho más ambicioso: «Este algoritmo podría servir para personas con discapacidad visual. Sería muy interesante, por ejemplo, tener un asistente que describiera los objetos que ves en un museo o que se suben a Internet. Nuestro algoritmo funcionaría, lo que hace falta es un software, que todavía está en desarrollo, capaz de proporcionar la información. Digamos que el algoritmo capacita a la máquina para explicar lo que hay, no para reconocerlo».

«Este algoritmo podría servir para describir imágenes a personas con discapacidad visual»

Este proyecto es la tesis de Gustavo Rivas. Una tesis que aún cuenta con dos años por delante para alcanzar un mayor nivel de perfección. «El lenguaje natural, como área, va a crecer mucho en los próximos años. Es algo apasionante».