Bei der diesjährigen Internationalen Mathematik-Olympiade (IMO), dem weltweit renommiertesten Wettbewerb in Australien, wurden Modelle der künstlichen Intelligenz auf die Probe gestellt. Googles Gemini und OpenAIs ChatGPT gaben bekannt, dass sie beide im Wettbewerb Goldmedaillen gewonnen haben. Google Deepmind gab bekannt, dass sein KI-Chatbot offiziell am Wettbewerb teilgenommen und fünf der sechs Fragen korrekt und ohne menschliches Eingreifen lösen konnte. OpenAI hingegen nutzte für den Test ein experimentelles Forschungsmodell, dessen Ergebnisse unabhängig ausgewertet wurden.
Die Leistung von Gemini und ChatGPT
IMO ist einer der ältesten jährlichen Mathematikwettbewerbe für Gymnasiasten und wird in einem anderen Land ausgetragen. Der Schwerpunkt des Wettbewerbs liegt auf mathematischen Beweisen statt auf lösungsorientierten Problemen. Die Teilnehmer müssen Logik, verschiedene mathematische Theoreme und Kenntnisse der angewandten Mathematik nutzen, um einen Beweis zu erbringen. Die Qualität des Beweises wird anschließend von Gutachtern bewertet, und die Teilnehmer erhalten Punkte.
In separaten Posts auf X (früher bekannt als Twitter) gaben Demis Hassabis, CEO von Google DeepMind, und Alexander Wei, Mitglied des technischen Personals von OpenAI, bekannt, dass ihre Chatbots bei der IMO 2025 Goldmedaillen-Niveau erreicht haben. Sowohl Gemini als auch ChatGPT lösten fünf von sechs Aufgaben und erreichten 35 von 42 Punkten, was für eine Goldmedaille ausreicht. Laut Google ist es das erste Mal, dass ein KI-System bei der IMO, dem weltweit führenden Mathematikwettbewerb für Studierende im Vorfeld der Universitäten, offiziell die Goldmedaillen-Hürde erreicht hat. Das Ergebnis wurde von den IMO-Koordinatoren bestätigt, die die Arbeit des Modells nach denselben Maßstäben bewerteten wie menschliche Teilnehmer.
Laut einem Bericht von TechCrunch nahm auch OpenAI inoffiziell am Wettbewerb teil. Gerüchten zufolge hat das Unternehmen drei ehemalige IMO-Medaillengewinner, die mit dem Bewertungssystem bestens vertraut waren, als externe Gutachter engagiert. Dem Bericht zufolge teilte das KI-Unternehmen der IMO anschließend die Ergebnisse mit.
Wei betonte in seinem Beitrag, dass die Ergebnisse einstimmig bekannt gegeben wurden.Von den KI-Unternehmen verwendete Modelle
Während für den Wettbewerb das Gemini Deep Think-Modell verwendet wurde, nutzte OpenAI für die Olympiade ein ungenanntes experimentelles Forschungsmodell.