OpenAI upgradet zijn slimste AI-model met verbeterde redeneervaardigheden

OpenAI heeft vandaag een verbeterde versie aangekondigd van zijn meest capabele kunstmatige-intelligentiemodel tot nu toe – een versie die nog meer tijd nodig heeft om over vragen na te denken – slechts een dag nadat Google zijn eerste model van dit type had aangekondigd.
Het nieuwe model van OpenAI, genaamd o3, vervangt o1, dat het bedrijf in september introduceerde. Net als o1 besteedt het nieuwe model tijd aan het nadenken over een probleem om betere antwoorden te kunnen geven op vragen die stap voor stap logisch redeneren vereisen. (OpenAI heeft ervoor gekozen om de bijnaam “o2” over te slaan, omdat dit al de naam is van een mobiele provider in Groot-Brittannië.)
“Wij beschouwen dit als het begin van de volgende fase van AI”, zei Sam Altman, CEO van OpenAI, vrijdag tijdens een livestream. “Waar je deze modellen kunt gebruiken om steeds complexere taken uit te voeren die veel redeneren vereisen.”
Het o3-model scoort veel hoger op verschillende maatstaven dan zijn voorganger, zegt OpenAI, waaronder maatstaven die complexe codeergerelateerde vaardigheden en geavanceerde wiskundige en natuurwetenschappelijke vaardigheden meten. Het is drie keer beter dan o1 in het beantwoorden van vragen van ARC-AGIeen benchmark die is ontworpen om het vermogen van AI-modellen te testen om te redeneren over extreem moeilijke wiskundige en logische problemen waarmee ze voor het eerst worden geconfronteerd.
Google volgt een soortgelijke onderzoekslijn. Noam Shazeer, een Google-onderzoeker, gisteren onthuld in een bericht op X dat het bedrijf een eigen redeneermodel heeft ontwikkeld, genaamd Gemini 2.0 Flash Thinking. Google’s CEO, Sundar Pichai, noemde het in zijn artikel ‘ons meest doordachte model tot nu toe’ eigen bericht.
De twee duelmodellen laten zien dat de concurrentie tussen OpenAI en Google heviger is dan ooit. Het is van cruciaal belang voor OpenAI om aan te tonen dat het vooruitgang kan blijven boeken terwijl het probeert meer investeringen aan te trekken en een winstgevend bedrijf op te bouwen. Google wil ondertussen wanhopig laten zien dat het voorop blijft lopen op het gebied van AI-onderzoek.
De nieuwe modellen laten ook zien hoe AI-bedrijven steeds verder kijken dan alleen het opschalen van AI-modellen om er meer intelligentie uit te persen.
OpenAI zegt dat er twee versies van het nieuwe model zijn, o3 en o3-mini. Het bedrijf maakt de modellen nog niet openbaar, maar zegt dat het buitenstaanders zal uitnodigen om zich aan te melden om ze te testen. OpenAI heeft vandaag ook meer details onthuld over technieken die worden gebruikt om o1 uit te lijnen. Dit houdt in dat er een modelredenering moet zijn over de aard van het verzoek dat wordt gedaan, om te ondervragen of dit in strijd is met de vangrails.