Toernooien

EXCLUSIEF: Eer debuteert een nieuwe AI -agent die uw scherm kan lezen en begrijpen


Het koos voor een restaurant, maar kon toen het proces niet voltooien omdat de plek die het koos een creditcard vereiste om een ​​reservering te bevestigen, waarna de gebruiker het moest overnemen. Je kunt flexibel zijn in je vraag – in een ander voorbeeld, het vragen om een ​​”hoog gewaardeerde” restaurant te boeken, betekende dat het zou kijken naar beoordelingen met hoge scores, hoewel de agent niet meer onderzoek doet dan dat. Het is geen kruisverwijzing OpenTable Reviews met gegevens uit andere delen van het web, vooral omdat al deze gegevens op apparaat worden verwerkt en niet naar de cloud worden verzonden.

Dit soort agentische kunstmatige intelligentie is het huidige modewoord in de technische sfeer. Mijn collega Will Knight heeft onlangs een AI -assistent getest die op internet zou kunnen bladeren en taken online zou kunnen uitvoeren. Google onthulde eind vorig jaar zijn Gemini 2 AI -model opgeleid om namens u acties te ondernemen. Het verlengt ook het idee van een generatieve gebruikersinterface voor smartphones – bij MWC 2024 zagen we een paar bedrijven werken aan manieren om met apps te communiceren zonder apps te gebruiken, in plaats daarvan leunend op AI -assistenten om een ​​gebruikersinterface te genereren terwijl u een opdracht uitgaf.

De aanpak van Honor voelt enigszins op wat konijn – van het beruchte konijn R1 – doet met de leermodus, waar je de assistent handmatig traint om een ​​taak te voltooien. Het is niet nodig om toegang te krijgen tot de applicatieprogrammeerinterface (API) van een app, de traditionele manier waarop apps of services met elkaar communiceren. De agent onthouden het proces, zodat u vervolgens de opdracht kunt uitgeven en de taak kunt laten uitvoeren.

Maar Honor zegt dat zijn zelfredzame AI-uitvoeringsmodel niet is getraind om strikte stappen te volgen-het is in staat tot multimodale schermcontextherkenning om taken autonoom uit te voeren. In plaats van de assistent te trainen om elk deel van de OpenTable-app te leren, is het in staat om de semantische elementen van de gebruikersinterface te begrijpen en zal het volgen met een proces van meerdere stappen om uw verzoek uit te voeren. Honor benadrukte dat dit proces kosteneffectiever was: “In tegenstelling tot concurrenten zoals Apple, Samsung en Google, die afhankelijk zijn van externe API’s – die in hogere operationele kosten opleveren – beheert de AI -agent van Honor onafhankelijk een breed scala aan taken.”

Fotografie: Julian Chokkattu



Source link

Related Articles

Back to top button