Lo mejor del 2023 en IA (7 artículos formidables)
En el 2023 se cumplieron 5 años de haber fundado el Colegio de Matemáticas Bourbaki, para toda la comunidad dedicada a la investigación y aplicación de la Inteligencia Artificial, sin lugar a dudas el escenario actual es el optimista de ese entonces, siendo cautelosos.
El último año en particular ha sido vertiginoso con la llegada de los modelos generativos como ChatGPT, Modjourney, DALL·E 2, GPT-4, Gemini, los cuales han llevado la inteligencia artificial a un estado del arte boyante tanto para el gran público como para los científicos involucrados.
En esta edición de nuestro boletín, despedimos el año con una selección de los trabajos en Inteligencia Artificial más relevantes, sorprendentemente no todos ellos están relacionados con los modelos generativos. Esperamos que disfruten mucho de la lectura de los artículos originales los cuales hemos agregado a la lista.
Extendiendo el teorema de los 4 colores utilizando IA simbólica
Uno de los primeros resultados que se demostraron matemáticamente con la ayuda de las computadoras fue el llamado teorema de los cuatro colores el cual garantiza que cualquier mapa plano dividido en regiones (pensemos en países o en regiones dentro de un país) puede colorearse utilizando a lo más 4 distintos colores y ningún par de zonas adyacentes tendrán el mismo color.
Para extender este resultado pensemos que en lugar de elegir un color para cada región, vamos a asignar un número entre 1, 2, ... , K (algún entero fijo), en este caso un K-embalaje consiste en garantizar que si dos vértices de un grafo tienen el mismo entero asignado k, entonces necesariamente estarán separados en el grafo por al menos ese mismo número de vértices conectados. Esta conjetura estuvo abierta por más de 20 años y se le conoce como el broadcast coloring problem pues tiene aplicaciones a la localización de estaciones de transmisión, por ejemplo de radio, también podría utilizarse en un problema de cadena de suministro.
En este artículo publicado este año fue demostrado utilizando Inteligencia Artificial Simbólica, en particular los conocidos como SAT solvers, esta técnica ha cobrado una enorme relevancia en los últimos años gracias a su versatilidad, inclusive problemas tan complicados como la conjetura de Collatz han sido intentados con estas herramientas.
ChatGPT & GPT-4
No solo la Inteligencia Artificial, sino en general la industria y buena parte de nuestra sociedad serían difíciles de reconocer en el 2023 sin el auge y el innegable éxito de ChatGPT y su versión más sofisticada. Aunque existen algunos críticos de este modelo y en especial de llamarlo Inteligencia Artificial, desde nuestro punto de vista sería una necedad no considerar a estos modelos matemáticos como uno de los logros más exitosos desde el auge de las computadoras.
Es cierto que podríamos distinguir dos aspectos muy distintos de estos modelos, uno como un producto comercial y el otro como un desarrollo científico, les compartimos reporte técnico de GPT-4 que contiene los grandes aciertos y algunos de los retos de esta tecnología.
Auto-corrección moral en Large Language Models
Una de las críticas más ácidas a ChatGPT es que su éxito se debe a la gran cantidad de información procesada y no necesariamente a algún gran avance en el entrenamiento o diseño de este modelo. Sin embargo ya en otras ocasiones hemos hablado en este boletín sobre el que posiblemente sea la gran aportación de ChatGPT, a saber el Aprendizaje por Refuerzo con Retroalimentación Humana (RLHF).
En un trabajo publicado por Anthropic hace algunos meses, se descubrió empíricamente que esta herramienta en el entrenamiento, vista como un calibrado del modelo puede estar muy relacionada con la viabilidad de ChatGPT como un producto abierto al público. Pueden revisar más detalles en este artículo.
Predecir interacciones cuánticas en computadoras clásicas
Predecir as interacciones de la física cuántica parece una tarea demasiado complicada, especialmente utilizando computación clásica en la que todas las operaciones son deterministas.El año pasado se publicó por primera vez en la revista Science un artículo en el que utilizando modelos de machine learning y una base de datos con información sobre interacciones cuánticas se logró predecir satisfactoriamente un Hamiltoniano local con n qubits, utilizando una cantidad polinomial en n de datos.
Desafortunadamente el grado del polinomio en este caso era demasiado grande lo cual hacía poco viable este enfoque, en este artículo publicado en 2023 se logró reducir el tamaño de la base de datos utilizando únicamente log(n) registros.Visión nocturna térmográfica con redes neuronales.
Venciendo al efecto fantasma en imágenes nocturnas
La visión nocturna utiliza numerosas técnicas las cuales hacen posible que inclusive en ambientes hostiles puedan lograrse imágenes con alta calidad, una de ellas utiliza la emisión de calor y se le conoce como termográfica.
Desafortunadamente estas técnicas pueden ser poco precisas en los contornos de las imágenes y ocasionar el efecto fantasma.Este 2023 en la revista Nature se publicó este artículo en el que utilizado redes neuronales convolucionales se propuso un método altamente eficaz que inclusive logra la cota de Cramér–Rao para la predicción del calor en una imagen lo cual desaparece el efecto fantasma en las imágenes.
Descubrir nuevos materiales usando Graph Neural Networks
Ya les habíamos publicado en una edición pasada de nuestro boletín cómo utilizando redes neuronales sobre grafos se ha logrado identificar una gran cantidad de materiales útiles inorgánicos nuevos con potenciales aplicaciones. Por esta razón, consideramos que esta es una de las grandes aplicaciones del 2023 en IA.
Fue un grupo de investigadores de Google DeepMind y University of California, Berkeley que utilizaron Aprendizaje Profundo para el desarrollo de materiales inorgánicos que puedan servir para el descubrimiento de super-computadoras, de baterías que sean más eficientes o los célebres super-conductores considerados el santo grial de la ciencia de materiales. En este artículo pueden encontrar la información detallada.
Los modelos generativos podría esconder mensajes secretos perfectamente
La esteganografía a diferencia de la criptografía, busca esconder un mensaje secreto de tal manera que ni el mensaje ni la existencia de un mensaje secreto se pueda descubrir fácilmente. Pensemos por ejemplo en una publicación sobre un tema peregrino en alguna red social a la que en cada 10 letras incluimos las de un mensaje secreto que queremos transmitir.
En este artículo se logró por primera vez un algoritmo para esconder la información dentro de una distribución de tal manera que existe una garantía matemática de que es imposible descubrir el secreto. Esto podría utilizarse en texto, audio, imágenes u otro canal para transmitir la información y está basado en el trabajo de Christian Cachin. Desafortunadamente el tipo de texto generado por los seres humanos no cumple las hipótesis, por eso es que los investigadores aprovecharon el desarrollo de los modelos generativos como GPT para experimentar sobre estas técnicas logrando resultados asombrosos.
Oferta académica
- Track de Ciencia de Datos. (49 semanas).
- Machine Learning & AI for the Working Analyst ( 12 semanas).
- Matemáticas para Ciencia de Datos ( 24 semanas).
- Especialización en Deep Learning. (12 semanas).
- Track de Finanzas Cuantitativas (49 semanas)
- Aplicaciones Financieras De Machine Learning E IA ( 12 semanas).
- Las matemáticas de los mercados financieros (24 semanas).
- Deep Learning for Finance (12 semanas).