Toernooien

Technische leiders reageren op de snelle opkomst van Deepseek


Word lid van onze dagelijkse en wekelijkse nieuwsbrieven voor de nieuwste updates en exclusieve inhoud over toonaangevende AI-dekking. Leer meer


Als je het niet had gehoord, is er een nieuwe AI -ster in de stad: Diepeekde dochteronderneming van het Hong Kong-gebaseerde kwantitatieve analyse (Quant) Firm High Flyer Capital Management, heeft schokgolven in Silicon Valley en de bredere wereld gestuurd met de release eerder deze week van een nieuw open source groot redeneermodel, Deepseek R1, dat overeenkomt Openai’s krachtigste beschikbare model O1 – en met een fractie van de kosten voor gebruikers en voor het bedrijf zelf (bij het trainen).

Terwijl de komst van Deepseek R1 al een consequent topsy turvy, snel bewegende, intens competitieve markt voor nieuwe AI -modellen heeft herschikt – zag Openai Jockeying met antropische en Google voor de krachtigste beschikbare beschikbare modellen, terwijl meta -platforms vaak binnenkwamen ” dichtbij genoeg ”Open source rivalen – het verschil deze keer is het bedrijf achter het hot -model is gevestigd in China, de geopolitieke”razendheid‘Van de VS, en wiens technische sector tot op dit moment algemeen werd beschouwd als inferieur aan die van Silicon Valley.

Als zodanig heeft het geen tekort veroorzaakt van handwringing en existentialisme van ons en westerse bloc-techneuten, die plotseling twijfelen aan Openai en de algemene grote technische strategie om meer geld en meer berekeningen te gooien (grafische verwerkingseenheden, GPU’s, de krachtige gamingchips typisch gebruikt om AI -modellen te trainen) naar het probleem van het uitvinden van steeds krachtigere modellen.

Toch hebben sommige westerse technische leiders een grotendeels positieve publieke reactie gehad op de snelle beklimming van Deepseek.

Marc Andreessen, mede-uitvinder van de baanbrekende mozaïekwebbrowser, mede-oprichter van het NetScape-browserbedrijf en de huidige algemene partner bij de Beroemde Andreessen Horowitz (A16Z) durfkapitaalbedrijf, Geplaatst op X vandaag: “Deepseek R1 is een van de meest verbazingwekkende en indrukwekkende doorbraken die ik ooit heb gezien – en als open source, een diepgaand geschenk aan de wereld (Robot Emoji, Salute Emoji).”

Yann Lecun, de belangrijkste AI -wetenschapper voor de fundamentele AI Research (FAIR) -afdeling van Meta, gepost op zijn LinkedIn -account:

“Aan mensen die de uitvoering van Deepseek zien en denken:
‘China overtreft de VS in AI.’
Je leest dit verkeerd.
De juiste lezing is:
‘Open source -modellen overtreffen gepatenteerde.’

Deepseek heeft geprofiteerd van Open Research and Open Source (bijv. Pytorch en lama van Meta)
Ze kwamen met nieuwe ideeën en bouwden ze bovenop het werk van anderen.
Omdat hun werk is gepubliceerd en open source is, kan iedereen ervan profiteren.
Dat is de kracht van open onderzoek en open source. ”

En zelfs Mark “Zuck” Zuckerberg, oprichter en CEO van Meta Ai, leek te proberen de opkomst van Deepseek tegen te gaan met de zijne eigen bericht op Facebook belooft dat een nieuwe versie van Facebook’s Open Source AI Model Family Lama “het toonaangevende stand van het kunstmodel” zou zijn wanneer deze ergens dit jaar wordt uitgebracht. Zoals hij het uitdrukte:

Dit wordt een bepalend jaar voor AI. In 2025 verwacht ik dat Meta AI de toonaangevende assistent zal zijn die meer dan 1 miljard mensen bedient, Lama 4 wordt het toonaangevende state of the art -model, en we zullen een AI -ingenieur bouwen die zal beginnen met het bijdragen van toenemende hoeveelheden code aan onze R&D pogingen. Om dit van stroom te voorzien, bouwt Meta een 2GW+ datacenter dat zo groot is dat het een aanzienlijk deel van Manhattan zou dekken. We brengen online ~ 1GW van Compute in ’25 en we eindigen het jaar met meer dan 1,3 miljoen GPU’s. We zijn van plan dit jaar $ 60-65B in Capex te investeren, terwijl we onze AI-teams ook aanzienlijk laten groeien, en we hebben het kapitaal om te blijven investeren in de komende jaren. Dit is een enorme inspanning, en in de komende jaren zal het onze kernproducten en bedrijven stimuleren, historische innovatie ontgrendelen en het leiderschap van de Amerikaanse technologie uitbreiden. Laten we gaan bouwen!

Hij deelde zelfs een afbeelding met het 2 Gigawatt -datacenter dat wordt genoemd in zijn bericht bedekt op Manhattan:

Het is duidelijk dat, zelfs als hij een toewijding om source AI te openen, niet van overtuigd is dat de diepgang van Deepseek om te optimaliseren voor efficiëntie, terwijl het gebruik van veel minder GPU’s dan grote laboratoria de juiste is voor meta, of voor de toekomst van AI.

Maar met Amerikaanse bedrijven die records opvoeden en/of uitgeven van nieuwe AI -infrastructuur die veel experts snel hebben opgemerkt (vanwege hardware/chip- en software -vooruitgang), blijft de vraag welke visie van de toekomst uiteindelijk zal winnen om de te worden Dominante AI -provider voor de wereld. Of misschien zal het altijd een veelvoud van modellen zijn met een kleiner marktaandeel? Blijf op de hoogte, omdat deze competitie dichterbij en feler wordt dan ooit.



Source link

Related Articles

Back to top button