Colocan una cámara en la cabeza de un bebé para que una inteligencia artificial aprenda nuevas palabras

Lunes 05 de Febrero de 2024, 13:47

Los hallazgos del estudio resultan valiosos para los futuros desarrolladores de IA interesados en crear modelos de IA que aprendan de manera similar a los humanos.



Científicos del Centro de Datos de la Universidad de Nueva York divulgaron las conclusiones de un singular estudio en el campo de la inteligencia artificial, para el que colocaron cascos con cámaras en la cabeza de un bebé. El propósito de la investigación es doble. Por un lado, conseguir que los modelos de IA adquieran conocimientos de un modo similar a como lo hacen los humanos. En paralelo, echar luz sobre la forma en que los niños aprenden a asociar palabras con objetos.


La inteligencia artificial quiere aprender cómo los niños

De acuerdo a investigaciones previas, los niños adquieren sus primeras palabras entre los seis y nueve meses de vida. A los dos años, en promedio, tienen un vocabulario de 300 términos. Amén de las cifras, aún no se conoce en detalle cómo la mecánica empleada por los pequeños para asociar el léxico con el entorno.

Los investigadores de la Universidad de Nueva York consiguieron avances en ese debate científico. Publicados en la revista Science, los hallazgos del estudio se basaron en un modelo de aprendizaje automático que aprendió palabras empleando imágenes capturadas por un niño llamado Sam, con una perspectiva en primera persona.

“Al utilizar modelos de IA para estudiar el problema del aprendizaje de idiomas, podemos abordar los debates clásicos sobre qué ingredientes se necesitan para adquirir palabras”, dijo Brenden Lake, coautor del estudio.

Para entrenar el modelo, se basaron en más de 60 horas de grabaciones de audio y video tomados con una cámara colocada en la cabeza de Sam, a quien vemos en el video que abre este repaso. El pequeño usó el dispositivo desde que tenía seis meses de edad, hasta después de su segundo cumpleaños. Durante esos 19 meses, recopiló más de 600.000 fotogramas de video conectados a más de 37.500 expresiones, que transcribieron personas cercanas a él.

Tal como nota el sitio Popular Science, los investigadores crearon una red neuronal para dar sentido a lo que el nene veía y escuchaba. Ese modelo contaba con dos módulos abocados a tareas diferentes y complementarias: uno analizaba las imágenes tomadas por la cámara y el otro se enfocaba en el habla de Sam. Un detalle: no se utilizaron datos externos para la identificación de los objetos. Así, el sistema aprendió como lo hace un niño.


Una inteligencia artificial que aprende igual que los chicos

“Al utilizar modelos de IA para estudiar el problema real del aprendizaje de idiomas que enfrentan los niños, podemos abordar los debates clásicos sobre qué ingredientes se necesitan para adquirir palabras”, dijo Brenden Lake, coautor del estudio y profesor del Centro de Ciencia de Datos de la Universidad de Nueva York. “Parece que podemos conseguir más con solo aprender de lo que comúnmente se piensa”, observó.

Los investigadores evaluaron el modelo, presentándole cuatro imágenes extraídas de los datos capturados por la cámara de Sam. Luego, pidieron que elija la palabra que coincida con aquello que se muestra. La tasa de acierto fue superior al 61%.

Para entrenar el modelo, se basaron en más de 60 horas de grabaciones de audio y video tomados con una cámara colocada en la cabeza de Sam.

Además, identificó correctamente algunas imágenes que no estaban incluidas en el conjunto de datos de la cámara frontal del niño. Esto sugiere que pudo aprender de la información con la que fue entrenado y usarla para realizar observaciones de orden general; es decir, relacionar conceptos.

“Esto sugiere que el aprendizaje de palabras es factible a partir del tipo de datos que reciben los niños mientras utilizan mecanismos relativamente genéricos, como los que se encuentran en las redes neuronales”, concluyó Lake. De acuerdo a la fuente, estos hallazgos podrían resultar valiosos para crear modelos de IA que aprendan de manera similar a los humanos. /TN