Sluit u aan bij onze dagelijkse en wekelijkse nieuwsbrieven voor de laatste updates en exclusieve inhoud over toonaangevende AI-dekking. Meer informatie


Vergis je niet: AI voor ondernemingen is big business, vooral voor IBM.

IBM heeft al een omzet van $2 miljard op het gebied van generatieve AI en wil die groei nu versnellen. IBM breidt vandaag zijn zakelijke AI-activiteiten uit met de lancering van de derde generatie Granite Large Language Models (LLM’s). Een kernelement van de nieuwe generatie is de voortdurende focus op echte open source enterprise AI. IBM gaat nog een stap verder en zorgt ervoor dat modellen kunnen worden verfijnd voor zakelijke AI, met zijn InstructLab-mogelijkheden.

De vandaag aangekondigde nieuwe modellen omvatten opties voor algemeen gebruik met een 2 miljard en 8 miljard Granite 3.0. Er zijn ook Mixture-of-Experts (MoE)-modellen met Granite 3.0 3B A800M Instruct, Granite 3.0 1B A400M Instruct, Granite 3.0 3B A800M Base en Granite 3.0 1B A400M Base. Ter afsluiting van de update heeft IBM ook een nieuwe groep met geoptimaliseerde vangrail- en veiligheidsopties, waaronder de Granite Guardian 3.0 8B- en Granite Guardian 3.0 2B-modellen. De nieuwe modellen zullen beschikbaar zijn op IBM’s watsonX-service, maar ook op Amazon Bedrock, Amazon Sagemaker en Hugging Face.

“Zoals we bij onze laatste winstoproep vermeldden, bedraagt ​​de omzet die we hebben opgebouwd op het gebied van generatieve AI nu ruim $2 miljard op het gebied van technologie en consultancy”, zei Rob Thomas, senior vice-president en chief commercial officer bij IBM, tijdens een bijeenkomst briefing met pers en analisten. “Als ik terugdenk aan mijn 25 jaar bij IBM, weet ik niet zeker of we ooit een bedrijf hebben gehad dat in dit tempo is gegroeid.”

Hoe IBM bedrijfs-AI wil bevorderen met Granite 3.0

Granite 3.0 introduceert een reeks geavanceerde AI-modellen die zijn afgestemd op bedrijfstoepassingen.

IBM verwacht dat de nieuwe modellen een reeks zakelijke gebruiksscenario’s zullen helpen ondersteunen, waaronder: klantenservice, IT-automatisering, Business Process Outsourcing (BPO), applicatieontwikkeling en cyberbeveiliging.

De nieuwe Granite 3.0-modellen zijn getraind door het gecentraliseerde datamodelfabrieksteam van IBM, dat verantwoordelijk is voor het verzamelen en beheren van de gegevens die voor de training worden gebruikt.

Dario Gil, Senior Vice President en Directeur van IBM Research, legde uit dat het trainingsproces 12 biljoen tokens aan gegevens omvatte, waaronder zowel taalgegevens in meerdere talen als codegegevens. Hij benadrukte dat de belangrijkste verschillen met voorgaande generaties de kwaliteit van de gegevens en de architecturale innovaties waren die in het trainingsproces werden gebruikt.

Thomas voegde eraan toe dat het ook belangrijk is om te herkennen waar de gegevens vandaan komen.

“Een deel van ons voordeel bij het bouwen van modellen zijn de datasets die we hebben die uniek zijn voor IBM”, zegt Thomas. “We hebben een uniek, zou ik zeggen, perspectief in de industrie, waar we de eerste klant worden voor alles wat we bouwen, wat ons ook een voordeel geeft in de manier waarop we de modellen bouwen.”

IBM claimt hoogwaardige benchmarks voor Granite 3.0

Volgens Gil hebben de Granite-modellen opmerkelijke resultaten behaald bij een breed scala aan taken, waarbij ze beter presteren dan de nieuwste versies van modellen van Google, Anthropic en anderen.

“Wat je hier ziet zijn ongelooflijk goed presterende modellen, absoluut state-of-the-art, en daar zijn we erg trots op,” zei Gil.

Maar het zijn niet alleen de rauwe prestaties die Granite onderscheiden. IBM heeft ook sterk de nadruk gelegd op veiligheid en vertrouwen, door geavanceerde ‘Guardian’-modellen te ontwikkelen die kunnen worden gebruikt om te voorkomen dat de kernmodellen worden gejailbreakt of schadelijke inhoud produceren. De verschillende opties voor modelgroottes zijn ook een cruciaal element.

“Het maakt ons zo veel uit, en we hebben een les geleerd uit het opschalen van AI, dat gevolgtrekkingskosten essentieel zijn,” merkte Gil op. “Dat is de reden waarom we zo gefocust zijn op de omvang van de categorie modellen, omdat deze de combinatie van prestatie- en gevolgtrekkingskosten heeft die zeer aantrekkelijk is om gebruiksscenario’s in de onderneming te schalen.”

Waarom echte open source belangrijk is voor zakelijke AI

Een belangrijke onderscheidende factor voor Granite 3.0 is het besluit van IBM om de modellen uit te brengen onder de door Open Source Initiative (OSI) goedgekeurde Apache 2.0 open-source licentie.

Er zijn veel andere open modellen op de markt, zoals Meta’s Llama, die feitelijk niet verkrijgbaar zijn onder een door OSI goedgekeurde licentie. Dat is een onderscheid dat voor sommige ondernemingen van belang is.

“We hebben besloten dat we daar absoluut brandschoon in zullen zijn en hebben besloten een Apache 2-licentie aan te schaffen, zodat we onze bedrijfspartners maximale flexibiliteit geven om te doen wat ze moeten doen met de technologie”, legt Gil uit.

De tolerante Apache 2.0-licentie stelt IBM’s partners in staat hun eigen merken en intellectueel eigendom bovenop de Granite-modellen te bouwen. Dit helpt bij het bevorderen van een robuust ecosysteem van oplossingen en toepassingen, mogelijk gemaakt door de Granite-technologie.

“Het verandert compleet het idee van hoe snel bedrijven AI kunnen adopteren als je een permissieve licentie hebt die bijdragen mogelijk maakt, gemeenschap mogelijk maakt en uiteindelijk brede distributie mogelijk maakt”, aldus Thomas.

Verder kijken dan generatieve AI naar generatief computergebruik

Vooruitkijkend denkt IBM na over de volgende grote paradigmaverschuiving, iets dat Gil generatief computergebruik noemde.

In wezen verwijst generatief computergebruik naar de mogelijkheid om computers te programmeren door voorbeelden of aanwijzingen te geven, in plaats van expliciet stapsgewijze instructies uit te schrijven. Dit sluit aan bij de mogelijkheden van LLM’s zoals Granite, die tekst, code en andere uitvoer kunnen genereren op basis van de invoer die ze ontvangen.

“Dit paradigma waarin we niet de instructies schrijven, maar bijvoorbeeld de computer programmeren, is van fundamenteel belang, en we beginnen nog maar net te ontdekken hoe dat voelt door interactie met LLM’s,” zei Gil. “Je zult ons zien investeren en zeer agressief gaan in een richting waarin we met dit paradigma van generatief computergebruik de volgende generatie modellen, agentische raamwerken en nog veel meer dan dat kunnen implementeren. manier om computers te programmeren als gevolg van de Gen AI-revolutie.”