Sluit u aan bij onze dagelijkse en wekelijkse nieuwsbrieven voor de laatste updates en exclusieve inhoud over toonaangevende AI-dekking. Meer informatie


Nvidia heeft een krachtig open-source artificieel intelligentiemodel uitgebracht dat concurreert met eigen systemen van marktleiders als OpenAI en Google.

De nieuwe NVLM 1.0-familie van grote multimodale taalmodellen van het bedrijf, aangevoerd door de NVLM-D-72B met 72 miljard parameters, demonstreert uitzonderlijke prestaties bij visuele en taaltaken en verbetert tegelijkertijd de mogelijkheden voor alleen tekst.

“We introduceren NVLM 1.0, een familie van multimodale grote taalmodellen van grensklasse die state-of-the-art resultaten behalen op het gebied van visuele taaltaken, en concurreren met de leidende propriëtaire modellen (bijv. GPT-4o) en open-access-modellen, ‘ leggen de onderzoekers uit in hun artikel.

Door de modelgewichten publiekelijk beschikbaar te maken en te beloven de trainingscode vrij te geven, doorbreekt Nvidia de trend om geavanceerde AI-systemen gesloten te houden. Deze beslissing geeft onderzoekers en ontwikkelaars ongekende toegang tot de allernieuwste technologie.

Benchmarkresultaten waarbij NVIDIA’s NVLM-D-model wordt vergeleken met AI-giganten als GPT-4, Claude 3.5 en Llama 3-V, waaruit de competitieve prestaties van NVLM-D bij verschillende visuele en taaltaken blijken. (Credit: arxiv.org)

NVLM-D-72B: Een veelzijdige performer in visuele en tekstuele taken

Het NVLM-D-72B-model vertoont een indrukwekkend aanpassingsvermogen bij het verwerken van complexe visuele en tekstuele invoer. Onderzoekers gaven voorbeelden die het vermogen van het model benadrukken om memes te interpreteren, afbeeldingen te analyseren en stap voor stap wiskundige problemen op te lossen.

Met name verbetert de NVLM-D-72B zijn prestaties bij taken met alleen tekst na multimodale training. Hoewel veel vergelijkbare modellen een daling in de tekstprestaties zien, verhoogde de NVLM-D-72B de nauwkeurigheid met gemiddeld 4,3 punten in de belangrijkste tekstbenchmarks.

“Onze NVLM-D-1.0-72B laat aanzienlijke verbeteringen zien ten opzichte van de tekstbackbone op het gebied van alleen-tekst-wiskunde- en coderingsbenchmarks”, merken de onderzoekers op, waarmee ze een belangrijk voordeel van hun aanpak benadrukken.

Het nieuwe AI-model van NVIDIA analyseert een meme waarin academische samenvattingen worden vergeleken met volledige artikelen, waarmee het vermogen wordt aangetoond om visuele humor en wetenschappelijke concepten te interpreteren. (Credit: arxiv.org)

AI-onderzoekers reageren op het open-sourceinitiatief van Nvidia

De AI-gemeenschap heeft positief gereageerd op de release. Een AI-onderzoeker merkte op sociale media op: “Wauw! Nvidia heeft zojuist een 72B-model gepubliceerd dat op het gebied van wiskunde en codering vergelijkbaar is met lama 3.1 405B en ook visie heeft?

De beslissing van Nvidia om zo’n krachtig model openlijk beschikbaar te maken, zou het onderzoek en de ontwikkeling van AI in het hele veld kunnen versnellen. Door toegang te bieden tot een model dat kan wedijveren met propriëtaire systemen van goed gefinancierde technologiebedrijven, kan Nvidia kleinere organisaties en onafhankelijke onderzoekers in staat stellen een significantere bijdrage te leveren aan de vooruitgang van AI.

Het NVLM-project introduceert ook innovatieve architectonische ontwerpen, waaronder een hybride aanpak die verschillende multimodale verwerkingstechnieken combineert. Deze ontwikkeling zou de richting van toekomstig onderzoek op dit gebied kunnen bepalen.

NVLM 1.0: een nieuw hoofdstuk in open-source AI-ontwikkeling

Nvidia’s release van NVLM 1.0 markeert een cruciaal moment in de AI-ontwikkeling. Door een model open te sourcen dat kan wedijveren met propriëtaire giganten, deelt Nvidia niet alleen code, maar daagt het ook de structuur van de AI-industrie uit.

Deze stap zou een kettingreactie kunnen veroorzaken. Andere technologieleiders voelen mogelijk druk om hun onderzoek open te stellen, waardoor de vooruitgang op het gebied van AI over de hele linie mogelijk wordt versneld. Het zorgt ook voor een gelijk speelveld, waardoor kleinere teams en onderzoekers kunnen innoveren met tools die ooit voorbehouden waren aan technologiegiganten.

De release van NVLM 1.0 is echter niet zonder risico’s. Naarmate krachtige AI toegankelijker wordt, zullen de zorgen over misbruik en ethische implicaties waarschijnlijk toenemen. De AI-gemeenschap staat nu voor de complexe taak om innovatie te bevorderen en tegelijkertijd vangrails te creëren voor verantwoord gebruik.

Het besluit van Nvidia roept ook vragen op over de toekomst van AI-bedrijfsmodellen. Als state-of-the-art modellen vrij beschikbaar komen, moeten bedrijven mogelijk opnieuw nadenken over de manier waarop ze waarde creëren en hun concurrentievoordeel op het gebied van AI behouden.

De echte impact van NVLM 1.0 zal zich de komende maanden en jaren ontvouwen. Het zou een tijdperk van ongekende samenwerking en innovatie op het gebied van AI kunnen inluiden. Of het zou een afrekening kunnen afdwingen met de onbedoelde gevolgen van algemeen beschikbare, geavanceerde AI.

Eén ding is zeker: Nvidia heeft een schot gelost in de boeg van de AI-industrie. De vraag is nu niet óf het landschap zal veranderen, maar hoe dramatisch – en wie zich snel genoeg zal aanpassen om te gedijen in deze nieuwe wereld van open AI.