Googles Gemini konkurriert mit OpenAI und erreicht bei der Mathematik-Olympiade den „Goldmedaillen-Standard“

Googles Gemini konkurriert mit OpenAI und erreicht bei der Mathematik-Olympiade den „Goldmedaillen-Standard“

Die Internationale Mathematik-Olympiade: Eine Herausforderung der Extraklasse

Die Internationale Mathematik-Olympiade (IMO) zählt zu den weltweit renommiertesten Wettbewerben für Nachwuchsmathematiker. Jährlich treten sechs Schülerinnen und Schüler aus jedem teilnehmenden Land an, um sechs hochkomplexe mathematische Aufgaben zu lösen. Nur 8 % der Teilnehmer erhalten für ihre herausragenden Lösungen die begehrte Goldmedaille.

KI-Wettbewerb bei der IMO: OpenAI vs. Google

Die diesjährige IMO bot eine moderne Note, als die führenden Technologiegiganten OpenAI und Google mit ihren hochmodernen Sprachlernmodellen (LLMs) in den Wettbewerb einstiegen. Am Wochenende verkündete OpenAI eine bemerkenswerte Leistung: Sein LLM für experimentelles Denken erreichte ein Niveau, das normalerweise Goldmedaillengewinnern vorbehalten ist. Um dies zu überprüfen, testete OpenAI sein Modell anhand der IMO-Probleme von 2025 und hielt sich dabei strikt an die gleichen Bedingungen wie die menschlichen Teilnehmer. Das Modell musste in zwei 4, 5-stündigen Prüfungssitzungen komplexe Probleme ohne externe Tools oder Internetzugang lösen und Beweise in natürlicher Sprache erstellen.

Wir haben bei der Internationalen Mathematik-Olympiade 2025 mit einem LLM im Bereich allgemeines Denken eine Leistung auf Goldmedaillenniveau erreicht! Unser Modell löste erstklassige mathematische Probleme – auf dem Niveau der besten menschlichen Teilnehmer. Ein wichtiger Meilenstein für KI und Mathematik.https://t.co/u2RlFFavyT

– OpenAI (@OpenAI) 19. Juli 2025

Googles Gemini Deep Think: Ein starker Konkurrent

Parallel dazu gab Google kürzlich bekannt, dass sein fortschrittliches Gemini Deep Think-Modell fünf der sechs IMO-Probleme erfolgreich gelöst und dabei eine Leistung auf Goldmedaillenniveau erreicht hat. Diese verbesserte Version von Gemini integriert modernste Denkmodelle, die auf Googles neuesten Forschungsergebnissen basieren. Dazu gehören Techniken, die die gleichzeitige Erforschung mehrerer Problemlösungspfade ermöglichen, anstatt des traditionellen sequentiellen Ansatzes.

Laut dem Google DeepMind-Team sind die Fortschritte bei Gemini Deep Think bemerkenswert:

Um die Denkfähigkeiten von Deep Think optimal zu nutzen, haben wir diese Version von Gemini zusätzlich mit neuartigen Reinforcement-Learning-Techniken trainiert, die mehr Daten für mehrstufiges Denken, Problemlösung und Theorembeweise nutzen können. Wir haben Gemini außerdem Zugriff auf ein kuratiertes Korpus hochwertiger Lösungen für Mathematikprobleme gewährt und die Anweisungen um einige allgemeine Hinweise und Tipps zur Herangehensweise an IMO-Probleme ergänzt.

Zukünftige Verfügbarkeit erweiterter Modelle

Google plant, diese neue Version des Deep Think-Modells in Kürze einer ausgewählten Gruppe vertrauenswürdiger Tester vorzustellen. Anschließend wird es für Google AI Ultra-Abonnenten zugänglich sein und einen bedeutenden Fortschritt für die Anwendung von KI zur Lösung komplexer mathematischer Herausforderungen darstellen.

Quelle & Bilder

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert