Openai’s O3-Mini redeneermodel arriveert om Deepseek tegen te gaan

Casper de Boer31 januari 2025

4 7 minutes read

Word lid van onze dagelijkse en wekelijkse nieuwsbrieven voor de nieuwste updates en exclusieve inhoud over toonaangevende AI-dekking. Leer meer

Openai heeft op tijd een nieuw gepatenteerd AI -model uitgebracht om de snelle opkomst van open source rivaal Deepseek R1 tegen te gaan – maar zal het voldoende zijn om het succes van laatstgenoemde te stimuleren?

Tegenwoordig, na enkele dagen van geruchten en toenemende anticipatie onder AI -gebruikers op sociale media, Openal debuteert o3-minihet tweede model in zijn nieuwe familie van ‘Reasions’, Al -modellen die iets meer tijd nemen om te ‘denken’, analyseren hun eigen processen en reflecteren op hun eigen ‘denkketens’ voordat ze reageren op gebruikersvragen en -inputs met nieuwe uitgangen.

Het resultaat is een model dat kan presteren op het niveau van een promovendus of zelfs de graadhouder bij het beantwoorden van harde vragen in wiskunde, wetenschap, engineering en vele andere gebieden.

Het O3-Mini-model is nu beschikbaar op Chatgpt, inclusief de gratis Tier, en Openai’s Application Programming Interface (API), en het is eigenlijk goedkoper, sneller en meer performant dan het vorige high-end model, Openai’s O1 en zijn sneller, Lagere parameters en zus, o1-mini.

Hoewel het onvermijdelijk zal worden vergeleken met Deepseek R1, en de releasedatum als een reactie, is het belangrijk om te onthouden dat O3 en O3-Mini goed werden aangekondigd vóór de januari-release van Deepseek R1, in december 2024-en die Openai CEO Sam Altman verklaarde eerder op X Dat vanwege feedback van ontwikkelaars en onderzoekers tegelijkertijd naar Chatgpt en de Openai API zou komen.

In tegenstelling tot Deepseek R1 zal O3-Mini niet beschikbaar worden gesteld als een open source-model-wat betekent dat de code niet kan worden genomen en gedownload voor offline gebruik, noch in dezelfde mate aangepast, wat de aantrekkingskracht ervan kan beperken in vergelijking met Deepseek R1 voor sommige toepassingen.

OpenAI heeft geen verdere details verstrekt over het (veronderstelde) grotere O3-model dat in december samen met O3-Mini werd aangekondigd. Op dat moment stond Openai’s opt-in vervolgkeuzelijst voor het testen van O3 dat het een “vertraging van meerdere weken” zou ondergaan voordat derden het konden testen.

Prestaties en functies

Net als O1 is Openai O3-Mini geoptimaliseerd voor redenering in wiskunde, codering en wetenschap.

De prestaties zijn vergelijkbaar met OpenAI O1 bij het gebruik van middelgrote redeneerinspanning, maar biedt de volgende voordelen:

24% snellere responstijden vergeleken met O1-Mini (Openai gaf hier geen specifiek nummer, maar kijkend naar evaluatiegroep van derden De tests van kunstmatige analyse, de responstijd van O1-Mini is 12,8 seconden om 100 tokens te ontvangen en te uitvoeren. Dus voor O3-mini zou een snelheidsstoot van 24% de responstijd dalen tot 10,32 seconden.)
Verbeterde nauwkeurigheid, waarbij externe testers de voorkeur geven aan de antwoorden van O3-Mini 56% van de tijd.
39% minder grote fouten over complexe vragen uit de praktijk.
Betere prestaties bij het coderen en STEM -taken, vooral bij het gebruik van hoge redeneerinspanning.
Drie redeneerinspanningsniveaus (laag, gemiddeld en hoog), waardoor gebruikers en ontwikkelaars de nauwkeurigheid en snelheid in evenwicht kunnen brengen.

Het beschikt ook over indrukwekkende benchmarks, die O1 in sommige gevallen zelfs overtreft, volgens de O3-Mini System Card Openai die online werd uitgebracht (en die eerder werd gepubliceerd dan de officiële aankondiging van de beschikbaarheid van het model).

Het contextvenster van O3-Mini-het aantal gecombineerde tokens dat het kan invoeren/uitvoer in een enkele interactie-is 200.000, met een maximum van 100.000 in elke uitgang. Dat is hetzelfde als het volledige O1 -model en overtreft het contextvenster van Deepseek R1 van ongeveer 128.000/130.000 tokens. Maar het is ver onder het nieuwe contextvenster van Google Gemini 2.0 Flash Thinking tot 1 miljoen tokens.

Hoewel O3-Mini zich richt op redeneermogelijkheden, heeft het nog geen Vision-mogelijkheden. Ontwikkelaars en gebruikers die afbeeldingen en bestanden willen uploaden, moeten in de tussentijd O1 blijven gebruiken.

De concurrentie opwarmt

De komst van O3-mini markeert de eerste keer dat Openai een redeneermodel beschikbaar maakt voor gratis chatgpt-gebruikers. De eerdere O1 -modelfamilie was alleen beschikbaar voor het betalen van abonnees van de Chatgpt Plus, Pro en andere plannen, evenals via de betaalde programmeerinterface van Openai.

Zoals het deed met Garg Language Model (LLM) -gestuurde chatbots via de lancering van Chatgpt in november 2022, creëerde Openai in wezen de hele categorie redeneermodellen in september 2024 toen het voor het eerst O1 onthulde, een nieuwe klasse modellen met een nieuwe training met een nieuwe training met een nieuwe training met een nieuwe training met een nieuwe training regime en architectuur.

Maar Openai maakte, in overeenstemming met zijn recente geschiedenis, geen O1 open source, in tegenstelling tot de naam en de oorspronkelijke oprichtingsmissie. In plaats daarvan hield het de code van het model eigendom.

En in de afgelopen twee weken is O1 overschaduwd door de Chinese AI-startup Deepseek, die R1 lanceerde, een rivaliserend, zeer efficiënt, grotendeels open-source redeneermodel dat vrij beschikbaar is om te nemen, om te scholen en aan te passen door iedereen over de hele wereld, door iedereen over de hele wereld Als gratis gebruik op de website van Deepseek en mobiele app – een model dat naar verluidt is opgeleid voor een fractie van de kosten van O1 en andere LLM’s van Top Labs.

Deepseek R1’s Permissive MIT -licentievoorwaardengratis app/website voor consumenten, en beslissing om de codebase van R1 vrij beschikbaar te maken om te nemen en te wijzigen, heeft het geleid tot een echte explosie van gebruik zowel in de consumenten- als de bedrijfsmarkten – zelfs Openai -investeerder Microsoft En Antropische backer Amazon haastig om varianten ervan toe te voegen aan hun cloudmarktplaces. Pertlexiteit, het AI -zoekbedrijf, ook snel Een variant toegevoegd voor gebruikers.

Deepseek ook de chatgpt iOS -app ontbrong voor de nummer één plaats in de Amerikaanse Apple App Storeen is opmerkelijk voor het overtreffen van OpenAI door zijn R1 -model te verbinden met het zoeken naar web in zijn app en op internet, iets dat OpenAI nog niet heeft gedaan voor O1, wat leidt tot verdere techno -angst onder technische werknemers en anderen online dat China inhaalt of heeft de VS overtroffen in AI -innovatie – zelfs meer in het algemeen technologie.

Veel AI -onderzoekers en wetenschappers en top -VC’s zoals Marc Andreessen hebben echter de opkomst van Deepseek en de open inkoop in het bijzonder verwelkomd als een tij dat alle boten in het AI -veld opheft, waardoor de beschikbare intelligentie voor iedereen wordt verhoogd terwijl de kosten worden verlaagd.

Beschikbaarheid in chatgpt

Het model wordt nu wereldwijd uitgerold om gratis te worden, plus team- en pro -gebruikers, met toegang tot enterprise en onderwijs die volgende week komen.

Vrije gebruikers kunnen voor het eerst O3-mini proberen door de knop “Reden” in de chatbalk te selecteren of een antwoord te regenereren.
Berichtlimieten hebben 3x verhoogd voor plus- en teamgebruikers, een stijging van 50 tot 150 berichten per dag.
Pro-gebruikers krijgen onbeperkte toegang tot zowel O3-Mini als een nieuwe, nog hoger herstellende variant, O3-Mini-High.

Bovendien ondersteunt O3-Mini nu zoekintegratie binnen ChatGPT en biedt antwoorden relevante weblinks. Deze functie bevindt zich nog in de vroege stadia, omdat Openai zoekmogelijkheden verfijnt in zijn redeneermodellen.

API -integratie en prijzen

Voor ontwikkelaars is O3-Mini beschikbaar via de CHAT-voltooiingen API, Assistants API en Batch API. Het model ondersteunt functieaanroepen, gestructureerde uitgangen en ontwikkelaarsboodschappen, waardoor het gemakkelijk te integreren is in real-world applicaties.

Een van de meest opvallende voordelen van O3-mini is de kostenefficiëntie: het is 63% goedkoper dan Openai O1-Mini en 93% goedkoper dan het volledige O1-model, geprijsd op $ 1,10/$ 4,40 per miljoen tokens in/uit (met een 50% cache-korting ).

Toch verbleekt het nog steeds in vergelijking met de Betaalbaarheid van de officiële Deepseek APIHet aanbod van R1 voor $ 0,14/$ 0,55 per miljoen tokens in/uit. Maar gezien Deepseek is gevestigd in China en wordt geleverd met bijbehorende geopolitiek bewustzijn en veiligheidsproblemen over de gegevens van de gebruiker/onderneming die in en uit het model stroomt, is het waarschijnlijk dat OpenAI de voorkeurs-API blijft voor sommige beveiligingsgerichte klanten en ondernemingen in de VS en Europa.

Ontwikkelaars kunnen ook het redeneerinspanningsniveau (laag, medium, hoog) aanpassen op basis van hun applicatiebehoeften, waardoor meer controle over latentie en nauwkeurigheidsafwegingen mogelijk is.

Over veiligheid zegt Openai dat het iets gebruikte dat “deliberatieve uitlijning” wordt genoemd met O3-mini. Dit betekent dat het model werd gevraagd om te redeneren over de door de mens gescheurde veiligheidsrichtlijnen die het werd gegeven, meer van hun intentie en de schade te begrijpen die ze zijn ontworpen om te voorkomen en zijn eigen manieren te bedenken om ervoor te zorgen dat die schade wordt voorkomen. OpenAI zegt dat het model minder censorieus kan zijn bij het bespreken van gevoelige onderwerpen, terwijl het ook de veiligheid behoudt.

OpenAI zegt dat het model beter presteert dan GPT-4O bij het omgaan met veiligheids- en jailbreak-uitdagingen, en dat het uitgebreide externe veiligheidstests heeft uitgevoerd voorafgaand aan de release vandaag.

A Recent rapport behandeld in Bedraad (waar mijn vrouw werkt) toonde aan dat Deepseek bezweek aan elke jailbreak-prompt en poging tot 50 getest door beveiligingsonderzoekers, die Openai O3-Mini de voorsprong op Deepseek R1 kunnen geven in gevallen waarin veiligheid en veiligheid van het grootste belang zijn.

Wat is volgende?

De lancering van O3-Mini vertegenwoordigt de bredere inspanning van Openai om geavanceerde redenering AI toegankelijker en kosteneffectiever te maken in het licht van intensere concurrentie dan ooit tevoren van Deepseek’s R1 en anderen, zoals Google, die onlangs een gratis versie van zijn eigen versie heeft uitgebracht Rivaal redeneermodel Gemini 2 Flash Thinking met een uitgebreide invoercontext van maximaal 1 miljoen tokens.

Met zijn focus op STEM-redenering en betaalbaarheid wil Openai het bereik van AI-gedreven probleemoplossing in zowel consumenten- als ontwikkelaarstoepassingen uitbreiden.

Maar naarmate het bedrijf ambitieuzer wordt dan ooit in zijn doelen – onlangs een datacenter -infrastructuurproject van $ 500 miljard aankondigt met de naam Stargate met steun van SoftBank – blijft de vraag of de strategie goed genoeg zal betalen om de multibiljoenen verzonken erin te rechtvaardigen Investeerders met diepe zak zoals Microsoft en andere VC’s.

Aangezien open source-modellen de kloof in toenemende mate sluiten met OpenAI in de prestaties en het in kosten overtreft, zullen de naar verluidt superieure veiligheidsmaatregelen, krachtige mogelijkheden, gemakkelijk te gebruiken API en gebruikersvriendelijke interfaces voldoende zijn om klanten te onderhouden-vooral in de onderneming- Wie kan de kosten en efficiëntie prioriteit geven boven deze attributen? We zullen rapporteren over de ontwikkelingen terwijl ze zich ontvouwen.

Dagelijkse inzichten in zakelijke gebruiksscenario’s met VB dagelijks

Als je indruk wilt maken op je baas, heeft VB Daily je gedekt. We geven u de binnenkant van wat bedrijven doen met generatieve AI, van wettelijke verschuivingen tot praktische implementaties, zodat u inzichten kunt delen voor maximale ROI.

Lees ons privacybeleid

Bedankt voor het inschrijven. Bekijk hier meer VB -nieuwsbrieven.

Er is een fout opgetreden.