Chinese AI-modellen zijn wereldwijd populair en verslaan op sommige gebieden de Amerikaanse rivalen

Britt van den Heuvel17 december 2024

4 4 minutes read

De pogingen van China om de wereld van kunstmatige intelligentie te domineren zouden hun vruchten kunnen afwerpen, waarbij insiders uit de industrie en technologieanalisten aan CNBC vertellen dat Chinese AI-modellen al enorm populair zijn en gelijke tred houden met – en zelfs overtreffen – die van de VS in termen van prestaties.

AI is het nieuwste strijdtoneel tussen de VS en China geworden, waarbij beide partijen het als een strategische technologie beschouwen. Washington blijft de toegang van China beperken tot geavanceerde chips die zijn ontworpen om kunstmatige intelligentie aan te drijven, te midden van de vrees dat de technologie de nationale veiligheid van de VS zou kunnen bedreigen.

Het heeft China ertoe aangezet zijn eigen aanpak te volgen om de aantrekkingskracht en prestaties van zijn AI-modellen te vergroten, inclusief het vertrouwen op open source-technologie en het ontwikkelen van zijn eigen supersnelle software en chips.

China creëert populaire LLM’s

Net als enkele van de leidende Amerikaanse bedrijven op dit gebied ontwikkelen Chinese AI-bedrijven zogenaamde large-taalmodellen, of LLM’s, die zijn getraind op enorme hoeveelheden gegevens en die toepassingen zoals chatbots ondersteunen.

In tegenstelling tot de modellen van OpenAI, die de enorm populaire ChatGPT aandrijven, zijn veel van deze Chinese bedrijven dat wel het ontwikkelen van open-source of open-weight LLM’s die ontwikkelaars gratis en zonder strenge licentievereisten van de uitvinder kunnen downloaden en erop kunnen bouwen.

Op Hugging Face, een opslagplaats van LLM’s, worden Chinese LLM’s het meest gedownload, volgens Tiezhen Wang, een machine learning-ingenieur bij het bedrijf. Qwen, een familie van AI-modellen gemaakt door de Chinese e-commercegigant Alibabais het populairst op Hugging Face, zei hij.

“Qwen wint snel aan populariteit vanwege zijn uitstekende prestaties op concurrerende benchmarks”, vertelde Wang per e-mail aan CNBC.

Hij voegde eraan toe dat Qwen een “zeer gunstig licentiemodel” heeft, wat betekent dat het door bedrijven kan worden gebruikt zonder dat er “uitgebreide juridische beoordelingen” nodig zijn.

Qwen is verkrijgbaar in verschillende maten, of parameters, zoals ze bekend zijn in de wereld van LLM’s. Grote parametermodellen zijn krachtiger, maar brengen hogere rekenkosten met zich mee, terwijl kleinere modellen goedkoper zijn in het gebruik.

“Ongeacht de maat die je kiest, Qwen is waarschijnlijk een van de best presterende modellen die momenteel verkrijgbaar zijn”, voegde Wang eraan toe.

DeepSeek, een start-up, maakte onlangs ook furore met een model genaamd DeepSeek-R1. DeepSeek zei vorige maand dat zijn R1-model concurreert met OpenAI’s o1 – een model dat is ontworpen voor het redeneren of oplossen van complexere taken.

Deze bedrijven beweren dat hun modellen kunnen concurreren met andere open-sourceaanbiedingen, zoals Meta’s Llama, evenals gesloten LLM’s zoals die van OpenAI, voor verschillende functies.

“Het afgelopen jaar hebben we de opkomst gezien van Chinese open source-bijdragen aan AI met zeer sterke prestaties, lage servicekosten en een hoge doorvoersnelheid”, vertelde Grace Isford, een partner bij Lux Capital, per e-mail aan CNBC.

China dicht de kloof met Amerikaanse open-source AI-modellen, zegt mede-oprichter van Hugging Face

China stimuleert open source om mondiaal te worden

Het open sourcen van een technologie dient een aantal doelen, waaronder het stimuleren van innovatie naarmate meer ontwikkelaars er toegang toe hebben, en het opbouwen van een gemeenschap rond een product.

Het zijn niet alleen Chinese bedrijven die open-source LLM’s hebben gelanceerd. Facebook-moederbedrijf Meta en de Europese start-up Mistral hebben ook open-sourceversies van AI-modellen.

Maar nu de technologie-industrie verstrikt raakt in het vizier van de geopolitieke strijd tussen Washington en Peking, geven open-source LLM’s Chinese bedrijven nog een voordeel: ze zorgen ervoor dat hun modellen wereldwijd kunnen worden gebruikt.

“Chinese bedrijven zouden graag zien dat hun modellen buiten China worden gebruikt, dus dit is absoluut een manier voor bedrijven om mondiale spelers te worden in de AI-ruimte”, vertelde Paul Triolo, een partner bij het mondiale adviesbureau DGA Group, per e-mail aan CNBC.

Hoewel de focus momenteel op AI-modellen ligt, is er ook discussie over welke applicaties er bovenop zullen worden gebouwd – en wie in de toekomst dit mondiale internetlandschap zal domineren.

“Als je ervan uitgaat dat deze grensgebaseerde AI-modellen een inzet zijn, gaat het om waar deze modellen voor worden gebruikt, zoals het versnellen van grensverleggende wetenschap en technische technologie”, aldus Isford van Lux Capital.

De huidige AI-modellen zijn vergeleken met besturingssystemen, zoals Die van Microsoft Ramen, Googlen’s Android en Appel’s iOS, met het potentieel om een markt te domineren, zoals deze bedrijven doen op mobiele apparaten en pc’s.

Als dit waar is, wordt de inzet voor het opbouwen van een dominante LLM hoger.

China richt zich op grote taalmodellen (LLM’s) op het gebied van kunstmatige intelligentie.

Blackdovfx | Istock | Getty-afbeeldingen

“Zij (Chinese bedrijven) beschouwen LLM’s als het centrum van toekomstige technologische ecosystemen”, vertelde Xin Sun, hoofddocent Chinese en Oost-Aziatische zaken aan King’s College London, per e-mail aan CNBC.

“Hun toekomstige bedrijfsmodellen zullen afhankelijk zijn van het feit dat ontwikkelaars zich aansluiten bij hun ecosystemen, nieuwe applicaties ontwikkelen op basis van de LLM’s en gebruikers en gegevens aantrekken waaruit vervolgens winst kan worden gegenereerd op verschillende manieren, inclusief maar veel verder dan het aansturen van gebruikers om hun clouddiensten te gebruiken,” Zon toegevoegd.

Chipbeperkingen werpen twijfel op over de AI-toekomst van China

AI-modellen worden getraind op grote hoeveelheden gegevens, wat enorme hoeveelheden rekenkracht vereist. Momenteel, Nvidia is toonaangevend ontwerper van de daarvoor benodigde chips, de zogenaamde graphics processing units (GPU’s).

De meeste toonaangevende AI-bedrijven trainen hun systemen op de krachtigste chips van Nvidia – maar niet in China.

Het afgelopen jaar hebben de VS de exportbeperkingen voor geavanceerde halfgeleider- en chipproductieapparatuur naar China opgevoerd. Het betekent Nvidia’s toonaangevende chips kunnen niet naar het land worden geëxporteerd en het bedrijf heeft halfgeleiders moeten maken die aan de sancties voldoen om te kunnen exporteren.

Ondanks deze beperkingen zijn Chinese bedrijven er nog steeds in geslaagd geavanceerde AI-modellen te lanceren.

“Grote Chinese technologieplatforms hebben momenteel voldoende toegang tot rekenkracht om modellen te blijven verbeteren. Dit komt omdat ze grote aantallen Nvidia GPU’s hebben opgeslagen en ook binnenlandse GPU’s van Huawei en andere bedrijven benutten”, aldus Triolo van DGA Group.

Chinese bedrijven hebben hun inspanningen opgevoerd om levensvatbare alternatieven voor Nvidia te creëren. Huawei is een van de leidende spelers geweest bij het nastreven van dit doel in China, terwijl bedrijven dat graag doen Baidu en Alibaba hebben ook geïnvesteerd in het ontwerp van halfgeleiders.

“De kloof op het gebied van geavanceerde hardwarecomputing zal echter in de loop van de tijd groter worden, vooral volgend jaar als Nvidia zijn op Blackwell gebaseerde systemen uitrolt die beperkt zijn voor export naar China”, aldus Triolo.

Isford van Lux Capital merkte op dat China “systematisch zijn hele binnenlandse AI-infrastructuur buiten Nvidia heeft geïnvesteerd en uitgebreid met krachtige AI-chips van bedrijven als Baidu.”

“Of Nvidia-chips in China verboden zijn of niet, zal China er niet van weerhouden om te investeren en zijn eigen infrastructuur te bouwen om AI-modellen te bouwen en te trainen”, voegde ze eraan toe.

Source link

Britt van den Heuvel17 december 2024

4 4 minutes read