Google Cloud lanceert het Veo AI-videogeneratormodel op Vertex

1 3 minutes read

Sluit u aan bij onze dagelijkse en wekelijkse nieuwsbrieven voor de laatste updates en exclusieve inhoud over toonaangevende AI-dekking. Meer informatie

Terwijl Amazon een grote stap zet in de AI-ruimte met zijn nieuwe Nova-familie van basismodellen, verdubbelt Google zijn eigen multimodale AI-mogelijkheden. De clouddivisie van de technologiegigant heeft aangekondigd dat zijn nieuwste modellen voor het genereren van video en afbeeldingen, Veo en Imagen 3, nu beschikbaar zijn op Vertex AI.

Deze stap stelt teams in staat om geavanceerde video- en beeldgeneratiemogelijkheden te integreren in hun AI-workflows, waardoor diverse gebruiksscenario’s worden ontsloten, vooral in marketing en reclame. Het maakt Google Cloud ook de eerste hyperscaler die een videomodel aan zijn klanten aanbiedt.

Hoewel het Veo-model zich momenteel in een privépreview bevindt, zal Imagen 3 vanaf volgende week algemeen beschikbaar zijn voor alle Vertex AI-gebruikers. Opvallend is dat Imagen 3 ook bewerkingsfuncties bevat, waardoor gebruikers de gegenereerde afbeeldingen kunnen verfijnen om aan specifieke creatieve behoeften te voldoen.

Wat bieden Veo en Imagen 3?

Veo, voor het eerst onthuld op de I/O-ontwikkelaarsconferentie van Google, is het antwoord van Google DeepMind op concurrenten als Runway’s Gen-3 en OpenAI’s Sora, en levert een geavanceerde ervaring voor het genereren van video’s. Het model transformeert tekst- of beeldaanwijzingen in filmische, high-definition video’s in verschillende visuele stijlen, waardoor clips van meer dan 60 seconden lang worden gegenereerd. Wat het onderscheidt is de consistentie op frameniveau, waardoor onderwerpen naadloos binnen de opnames bewegen.

Imagen 3, ook van DeepMind, neemt de taak op zich van het genereren van tekst naar beeld en produceert fotorealistische beelden in verschillende stijlen. Google beweert dat het zijn voorgangers overtreft in detail, lichtnauwkeurigheid en artefactreductie.

Naast generatie hebben gebruikers op de toelatingslijst van Google ook toegang tot geavanceerde aanpassingsopties met Imagen 3. Deze omvatten het opschalen van afbeeldingen, inpainting, outpainting en achtergrondvervanging, allemaal begeleid door tekstprompts. Bovendien kunnen gebruikers referentieafbeeldingen aanleveren, waardoor Imagen 3 inhoud kan creëren die is afgestemd op specifieke merkesthetiek, logo’s of productkenmerken.

Bredere implicaties voor de industrie

Vertex AI is lange tijd het vlaggenschipplatform van Google Cloud geweest voor het stroomlijnen van de ontwikkeling en implementatie van AI-applicaties. Door Veo en Imagen 3 te integreren biedt het platform organisaties een nog uitgebreider pakket tools om te innoveren op het gebied van marketing, verkoop en daarbuiten.

Imagen 3 vereenvoudigt bijvoorbeeld het creëren van hoogwaardige assets zoals productafbeeldingen en sociale media-inhoud, terwijl Veo deze mogelijkheid uitbreidt door teams de mogelijkheid te bieden deze beelden om te zetten in gepolijste video’s. Het versnelt de productie, verlaagt de kosten en versnelt het maken van prototypen, waardoor teams snel hun creatieve strategieën kunnen herhalen.

“Klanten als Agoda gebruiken de kracht van AI-modellen als Veo, Gemini en Imagen om de productie van hun videoadvertenties te stroomlijnen, waardoor de productietijd aanzienlijk wordt verkort”, zegt Warren Barkley, senior director product management bij Google, in een blogpost. Hij benadrukte ook dat beide modellen veiligheidsfuncties bevatten zoals digitale watermerken en vangrails voor het modereren van inhoud om de risico’s die gepaard gaan met generatieve AI te beperken.

Andere early adopters zijn onder meer Mondelez International – eigenaar van merken als Oreo, Cadbury en Milka – en de wereldwijde marketing- en communicatiedienst WPP. Nu de basismodellen van Google hun bereik vergroten, krijgen bedrijven in alle sectoren een krachtige kans om opnieuw te bedenken hoe ze visuele inhoud creëren en leveren.

De concurrentie blijft heviger worden

Hoewel alle grote cloudproviders, waaronder Google Cloud, Amazon Web Services en Microsoft Azure, modellen voor het genereren van afbeeldingen hebben aangeboden op hun respectievelijke AI-orkestratieplatforms, is het genereren van video tot nu toe vrij zeldzaam geweest. De stap van Google om Veo vandaag in privépreview te lanceren, verandert daar verandering in.

Interessant genoeg maakte AWS kort na de Veo-aankondiging furore met re:Invent met de aankondiging van Nova Reel, een basismodel dat zes seconden durende video’s van studiokwaliteit genereert op basis van tekst- en beeldprompts.

Dit model zal, samen met andere uit de Nova-familie, beschikbaar komen via Amazon Bedrock, de volledig beheerde service van het bedrijf die is ontworpen om de creatie en implementatie van generatieve AI-applicaties te vereenvoudigen.

Microsoft lijkt op zijn beurt in dit stadium achter te blijven in deze categorie. De AI Foundry bevat geen modellen voor het genereren van video’s. We verwachten echter dat dit zal veranderen zodra Sora van OpenAI op de markt komt.

VB dagelijks

Blijf op de hoogte! Ontvang dagelijks het laatste nieuws in uw inbox

Door u te abonneren, gaat u akkoord met de Servicevoorwaarden van VentureBeat.

Bedankt voor het abonneren. Bekijk hier meer VB-nieuwsbrieven.

Er is een fout opgetreden.

Source link

Casper de Boer1 week ago

1 3 minutes read