IA conquista la Olimpiada de Matemáticas – psicolog-IA.com

En un avance sin precedentes que ha sacudido el mundo de la inteligencia artificial, los modelos de IA desarrollados por OpenAI y Google DeepMind (la división de IA de Google) han logrado medallas de oro en la Olimpiada Internacional de Matemáticas (IMO) de 2025. Este logro es considerado un hito histórico, ya que marca la primera vez que la IA alcanza esta distinción en la competición matemática más prestigiosa del mundo. La IMO es un evento que reúne a los mejores estudiantes de secundaria de élite de todo el mundo para enfrentar problemas complejos de matemáticas avanzadas, incluyendo álgebra, geometría, teoría de números y combinatoria.

Condiciones de Competición y Rendimiento

Los modelos de IA fueron evaluados bajo las mismas estrictas condiciones que los participantes humanos. Esto significa que compitieron en dos sesiones de 4.5 horas cada una, sin acceso a internet, herramientas externas, o calculadoras, y debiendo presentar sus soluciones en lenguaje natural. Tanto el modelo experimental de OpenAI como Gemini Deep Think de Google resolvieron correctamente cinco de los seis problemas del examen oficial, obteniendo 35 de los 42 puntos posibles. Esta puntuación es suficiente para una medalla de oro, una distinción que solo el 10% de los 630 participantes humanos logró. Las soluciones del modelo de OpenAI fueron evaluadas de forma anónima por exmedallistas de la IMO.

Modelos Utilizados y Avances Clave

OpenAI: Utilizó un modelo experimental de propósito general que no había recibido entrenamiento específico para la IMO. Su rendimiento se alcanzó mediante nuevas técnicas en aprendizaje por refuerzo y escalamiento del cómputo en tiempo de prueba. Este modelo puede «pensar durante horas» para resolver problemas complejos, lo que demuestra un avance significativo en el razonamiento generalista y el pensamiento creativo sostenido de la IA. Incluso los propios investigadores de OpenAI se mostraron sorprendidos, ya que no esperaban un rendimiento de este calibre tan pronto.

Google DeepMind: Participó con su modelo Gemini Deep Think, un sistema versátil con un modo de razonamiento mejorado para problemas complejos y técnicas como el pensamiento paralelo. Este modelo pudo explorar y combinar múltiples soluciones simultáneamente y entendió y resolvió los problemas directamente en lenguaje natural, eliminando la necesidad de cálculos formales o lenguajes matemáticos especializados.

Implicaciones y Reacciones

Este logro ha sido calificado como un paso crucial hacia la Inteligencia General Artificial (AGI) por el CEO de OpenAI, Sam Altman. Expertos como Sebastien Bubeck de OpenAI lo han definido como el «momento de pisar la luna para la inteligencia artificial». Incluso Gary Marcus, un conocido crítico de la IA, calificó el logro de «genuinamente impresionante». La capacidad de estos modelos para elaborar argumentos intrincados y herméticos a la altura de matemáticos humanos es particularmente destacable.

Sin embargo, hay matices importantes:

Disponibilidad: Ninguno de los modelos que lograron la medalla de oro está actualmente disponible para el público. Modelos públicos como GPT-4, Gemini 2.5 Pro, DeepSeek-R1 o Grok-4 fueron incapaces de alcanzar la puntuación mínima para una medalla de bronce en pruebas similares.
Controversia en la Participación: DeepMind fue invitada a participar oficialmente en las IMO. OpenAI, por su parte, no se inscribió oficialmente; tomó los problemas publicados y los resolvió por su cuenta, anunciando su resultado antes de la publicación oficial de los resultados humanos, lo que fue en contra de los deseos de la IMO de no robar protagonismo a los estudiantes.

A pesar de estas consideraciones, el avance es innegable. La innovación de OpenAI no formará parte de GPT-5 de inmediato, pero representa un modelo diferente que podría verse a finales de este año. Este desarrollo sugiere que los modelos de IA no solo resolverán problemas matemáticos avanzados, sino que también tendrán aplicaciones transformadoras en áreas como la física, la química y la resolución de problemas complejos en general, acelerando el descubrimiento científico.

Enlaces a las Noticias: