Computación
Importante Avance en Sistemas de Aprendizaje Automático
5 de Julio de 2010.
En los últimos 20 años aproximadamente, muchos de los avances clave de la investigación en inteligencia artificial se han materializado gracias al aprendizaje automático, con el cual los ordenadores aprenden a realizar predicciones mediante la estrategia de buscar patrones dentro de grandes conjuntos de datos con los que entrenarse.
Información adicional en:
Un nuevo enfoque llamado programación probabilística hace que sea mucho más fácil construir un sistema de aprendizaje automático, pero sólo es útil para un conjunto de problemas relativamente pequeño. Ahora, unos investigadores del MIT han descubierto cómo extender el enfoque a una clase de problemas mucho más grande, con implicaciones para temas tan diversos como la ciencia cognitiva, el análisis financiero y la epidemiología.
Históricamente, construir un sistema de aprendizaje automático capaz de aprender una nueva tarea le suele llevar a un estudiante de postgrado desde algunas semanas hasta varios meses. Un conjunto de nuevos lenguajes de programación probabilísticos y experimentales, uno de los cuales, Church, fue desarrollado en el MIT, promete acortar ese tiempo hasta un mero lapso de algunas horas.
En el corazón de cada uno de estos nuevos lenguajes está un algoritmo de inferencia, que indica al sistema de aprendizaje automático cómo llegar a conclusiones a partir de los datos presentados. El carácter generalista de estos algoritmos de inferencia es lo que confiere potencia a los lenguajes: El mismo algoritmo tiene que ser capaz de guiar un sistema que esté aprendiendo a reconocer objetos en imágenes digitales, o a filtrar correo spam, o a recomendar películas en DVD basándose en las alquiladas en ocasiones anteriores, o a realizar cualquier otra cosa que se le pueda pedir a un programa de inteligencia artificial.
Los algoritmos de inferencia utilizados actualmente en la programación probabilística dan buenos resultados manejando datos del tipo que en matemáticas reciben el nombre de Datos Discretos, pero les resulta difícil trabajar con información más compleja, del tipo que en matemáticas se conoce como Datos Continuos.
Por lo tanto, los diseñadores de lenguajes de programación probabilísticos tienen mucho interés en saber si es posible diseñar un algoritmo de inferencia de utilidad general que pueda manipular datos continuos. Desafortunadamente, la respuesta parece ser No.
Sin embargo, también hay buenas noticias: Daniel Roy y Cameron Freer, del MIT, han demostrado que existen grandes clases de problemas en los que intervienen datos continuos que son susceptibles de ser debidamente procesados mediante una solución general. Además, estos investigadores han descrito un algoritmo de inferencia que puede tratarlos. Un lenguaje de programación probabilístico con el nuevo algoritmo incorporado facilitaría el rápido desarrollo de una variedad mucho mayor de sistemas de aprendizaje automático.