Microsoft Copilot Vision is er en laat AI zien wat u online doet
Sluit u aan bij onze dagelijkse en wekelijkse nieuwsbrieven voor de laatste updates en exclusieve inhoud over toonaangevende AI-dekking. Meer informatie
Microsoft Tweede piloot wordt met de dag slimmer. Het door Satya Nadella geleide bedrijf heeft zojuist aangekondigd dat zijn AI-assistent nu ‘visie’-mogelijkheden heeft waarmee het met gebruikers op internet kan surfen.
Hoewel de functie voor het eerst werd aangekondigd in oktober van dit jaar, geeft het bedrijf er nu een preview van met een selecte groep Pro-abonnees. Volgens Microsoft kunnen deze gebruikers Copilot Vision activeren op webpagina’s die in hun Edge-browser zijn geopend en ermee communiceren met betrekking tot de inhoud die op het scherm zichtbaar is.
De functie bevindt zich nog in de beginfase van ontwikkeling en is behoorlijk beperkt, maar als deze eenmaal volledig is ontwikkeld, zou deze een game-changer kunnen blijken te zijn voor de zakelijke klanten van Microsoft – door hen te helpen met analyse en besluitvorming terwijl ze omgaan met producten die het bedrijf in huis heeft. zijn ecosysteem (OneDrive, Excel, SharePoint, enz.)
Op de lange termijn zal het ook interessant zijn om te zien hoe Copilot Vision het doet ten opzichte van meer open en capabele agentische aanbiedingen, zoals die van Anthropic en Emergence AI, waarmee ontwikkelaars agenten kunnen integreren om te zien, te redeneren en acties te ondernemen in applicaties van verschillende verkopers.
Wat kunt u verwachten van Copilot Vision?
Wanneer een gebruiker een website opent, kan deze al dan niet een beoogd doel hebben. Maar als ze dat wel doen, zoals bij onderzoek voor een academisch artikel, draait het proces van het uitvoeren van de gewenste taak om het doorlopen van de website, het lezen van de volledige inhoud ervan en het vervolgens raadplegen ervan (bijvoorbeeld of de inhoud van de website als referentie moet worden gebruikt). voor het papier of niet). Hetzelfde geldt voor andere dagelijkse webtaken zoals winkelen.
Met de nieuwe Copilot Vision-ervaring wil Microsoft dit hele proces eenvoudiger maken. In wezen heeft de gebruiker nu een assistent die zich onderaan zijn browser bevindt en die kan worden opgeroepen wanneer dat nodig is om de inhoud van de website te lezen, inclusief alle teksten en afbeeldingen, en om te helpen bij het nemen van beslissingen.
Het kan onmiddellijk alle benodigde informatie scannen, analyseren en verstrekken, rekening houdend met het beoogde doel van de gebruiker – net als een tweede paar ogen.
Deze mogelijkheid heeft verreikende voordelen (het kan uw workflows in een mum van tijd versnellen) en heeft ook grote gevolgen, aangezien de agent leest en beoordeelt wat u doorzoekt. Microsoft heeft er echter voor gezorgd dat alle context en informatie die door de gebruikers wordt gedeeld, wordt verwijderd zodra de Vision-sessie wordt gesloten. Het merkte ook op dat de gegevens van websites niet worden vastgelegd/opgeslagen voor het trainen van de onderliggende modellen.
“Kortom, we geven prioriteit aan auteursrechten, makers en de privacy en veiligheid van onze gebruikers – en stellen ze allemaal op de eerste plaats”, schreef het Copilot-team in een blogpost waarin de preview van de mogelijkheid werd aangekondigd.
Uitbreiding op basis van feedback
Momenteel is er een selecte set van Copilot Pro-abonnees in de VS, die zich hebben aangemeld voor het Copilot Labs-programma met vroege toegang, kunnen vision-mogelijkheden in hun Edge-browser gebruiken. De mogelijkheid zal opt-in zijn, wat betekent dat ze zich geen zorgen hoeven te maken dat AI hun schermen de hele tijd leest.
Bovendien werkt het in dit stadium alleen met geselecteerde websites. Microsoft zegt dat het feedback van de eerste gebruikers zal gebruiken en de mogelijkheden geleidelijk zal verbeteren, terwijl het de ondersteuning zal uitbreiden naar meer Pro-gebruikers en andere websites.
Op de lange termijn kan het bedrijf deze mogelijkheden zelfs uitbreiden naar andere producten in zijn ecosysteem, zoals OneDrive en Excel, waardoor zakelijke gebruikers gemakkelijker kunnen werken en beslissingen kunnen nemen. Er is echter nog geen officiële bevestiging. Om nog maar te zwijgen: gezien de voorzichtige aanpak die hier wordt gesignaleerd, kan het enige tijd duren voordat dit werkelijkheid wordt.
De stap van Microsoft om de preview van Copilot Vision te lanceren komt op een moment dat concurrenten de lat hoger leggen op het gebied van agenten-AI. Salesforce heeft AgentForce al uitgerold in zijn Customer 360-aanbod om workflows in domeinen als verkoop, marketing en service te automatiseren.
Ondertussen heeft Anthropic ‘Computer Use’ gelanceerd, waarmee ontwikkelaars Claude kunnen integreren om te communiceren met een computerdesktopomgeving, waarbij ze taken kunnen uitvoeren die voorheen alleen door menselijke werknemers werden uitgevoerd, zoals het openen van applicaties, interactie met interfaces en het invullen van formulieren.
Source link