Cd. de México.- Alex Wei, investigador de OpenAI, aseguró en X, que el último gran modelo de lenguaje (LLM) de razonamiento experimental de la compañía logró un rendimiento de medalla de oro en la Olimpiada Internacional de Matemáticas (IMO) 2025.
Esto confundió a algunos medios de comunicación, quienes aseguraron que OpenAI ganó esta medalla, pero en el inglés original, Wei no afirmó que se alzaron con la medalla, sino que lograron un nivel de medalla de oro.
"Me entusiasma compartir que nuestro más reciente modelo experimental de razonamiento de @OpenAI ha logrado superar uno de los grandes desafíos históricos de la inteligencia artificial: alcanzar un desempeño a nivel de medalla de oro en la competencia de matemáticas más prestigiosa del mundo: la Olimpiada Internacional de Matemática (IMO)", fue el posteo original que deja claro que se refieren al nivel obtenido y no a haber ganado la presea.
De hecho, en ese hilo de X, Wei detalla cómo el modelo de OpenAI resolvió 5 de los 6 problemas de la IMO de 2025, puntuado de forma independiente por tres antiguos medallistas del concurso, para un puntaje de 35 de 42 puntos posibles, valor suficiente para ganar el oro en la olimpiada.
Sin embargo, no solo medios en español reprodujeron la nota. Otros sitios anglosajones avalaron el presunto triunfo de la empresa de Sam Altman en la competencia.
Cabe destacar que la Olimpiada está dirigida a humanos y participan personas de nivel educativo preuniversitario. De acuerdo con la Fundación de la Olimpiada Internacional de Matemáticas, organismo detrás de la competencia, la edad debe ser menor a 20 años.
En el concurso participan jóvenes de cerca de 100 países de cinco continentes y cada nación envía un equipo de seis participantes. La edición de este año se realizó en Sunshine Coast, Australia.
El último documento de las regulaciones generales, disponible en el sitio de la IMO, señala que cada contendiente trabaja de manera individual y solo tiene permitido usar materiales para escribir y emplear herramientas de dibujo como regla y compás.
En cuanto a la utilización de dispositivos electrónicos como calculadoras, computadoras y equipos de comunicación, no están permitidos.
Por otro lado, el documento ni la Fundación mencionan la participación de empresas que desarrollan tecnología de IA, como Google u OpenAI.
Entonces, ¿por qué Google y AI están involucradas? Ambas compañías ponen a prueba sus modelos para medir el nivel de razonamiento que pueden alcanzar en la resolución de problemas matemáticos de ese nivel educativo.
Google citó en un blog al doctor Gregor Dolinar, presidente del IMO, quien declaró que el modelo de razonamiento DeepMind sí alcanzó el puntaje 35 de 42 posibles para equipararse a la medalla de oro.
"Podemos confirmar que Google DeepMind ha alcanzado el tan ansiado hito al obtener 35 de los 42 puntos posibles, una puntuación de medalla de oro. Sus soluciones fueron sorprendentes en muchos aspectos. Los evaluadores de IMO las consideraron claras, precisas y, en su mayoría, fáciles de seguir", mencionó Dolinar.
"Es muy emocionante ver los avances en las capacidades matemáticas de los modelos de IA, pero nos gustaría dejar claro que la IMO no puede validar los métodos, incluida la cantidad de computación utilizada, o si hubo alguna participación humana, o si los resultados pueden reproducirse", dijo Dolinar en una nota del certamen.
Thang Luong, jefe del equipo de razonamiento sobrehumano de Google Deep Mind, fue tajante y aclaró que su validación de la IMO es oficial y afirmó que existe una directriz oficial de la IMO para validar sus tests que no está disponible externamente.
Mikhail Samin, director ejecutivo de AI Governance and Safety Institute, organismo que empuja iniciativas que buscan regular la inteligencia artificial, se involucró en el tema en X.
Samin indicó que la IMO pidió a las empresas de IA que no robaran protagonismo a los niños y que esperaran una semana después de la ceremonia de clausura para anunciar los resultados, no obstante, OpenAI se adelantó y anunció los resultados antes de la ceremonia de clausura. Esto, acorde con un amigo suyo con conocimiento del asunto.
"Lamentablemente, OpenAI desea más publicidad e influencia que dejar que estos chicos increíblemente inteligentes celebren sus logros, así que anunciaron los resultados ayer", acusó Samin.
Noam Brown, investigador de OpenAI, respondió que sus resultados lo publicaron después de la ceremonia de clausura, tal como un organizador de IMO les solicitó.