Techniek

Iedereen in AI heeft het over Manu. We hebben het in de test gehouden.


Omdat generaal AI -agent Manus vorige week werd gelanceerd, verspreidde het zich online als een lopend vuurtje. En niet alleen in China, waar het werd ontwikkeld door de invloed van de Uhan-gebaseerde startup vlinder. Het is het wereldwijde gesprek aangegaan met de dominante stem in technologie, het prijzen van Twitter-mede-oprichter Jack Dorssi en omhelsde Face Product Lead Victor Musta. Sommigen hebben het een “tweede plaatsvervanger” genoemd en het vergelijken met het vorige AI -model dat de kunst verraste – zowel de onverwachte mogelijkheden als de bron.

Manus beweert de eerste algemene AI-agent te zijn in de wereldmore dan één AI-modellen (zoals etnografisch Clad 3.5 Sonnet en Alibaba Open-Source Quinn) en automatisch te werken in de grote verscheidenheid aan operationele agenten. (Het is anders dan AI Chattabs met DepSec, dat is gebaseerd op een enkel huishouden met een groot taalmodel en oorspronkelijk ontworpen voor gespreksgesprek)))

Ondanks alle hype hadden zeer weinig mensen de kans om het te gebruiken. Momenteel heeft de gebruiker een uitnodigingscode ontvangen onder 1% van de gewichtslijst. (Het is onduidelijk hoeveel mensen er in deze wachtlijst zitten, maar voor hoeveel interesse heeft het onenigheidskanaal van Manus meer dan 16,5 leden)))).

Overzicht van MIT -technologie Manus was in staat om toegang te krijgen, en toen ik het een proefrit gaf, ontdekte ik dat het lijkt om mee te werken met een zeer intelligente en bekwame stagiair: hoewel het soms ontbreekt aan wat er wordt gevraagd, wordt er verkeerd geïnterpreteerd of bezuinigingen om de taken uit te leggen, en de argumenten zijn duidelijk bewezen en bewezen. Uiteindelijk is het hoopvol maar niet perfect.

Net als het vorige product van zijn oorspronkelijke bedrijf, is een AI -assistent genaamd Monika, die werd gepubliceerd in 2023, voor de wereldwijde bezoekers. De Engelse standaard is ingesteld als taal en het ontwerp is duidelijk en minimaal.

Om in te voeren, moet een gebruiker een geldige uitnodigingscode invoeren. Het systeem instrueert vervolgens de gebruikers op een bestemmingspagina die vergelijkbaar is met de Chatzpt of DIPSC, de historische Tihassic-sessies verschijnen in een linkshandige kolom en een chat-invoervak ​​in het midden. De bestemmingspagina heeft ook de herziene voorbeeldfuncties – van de ontwikkeling van bedrijfsstrategieën tot interactief leren, van de aangepaste audiomeditatiesessie.

Andere op logica gebaseerde agenten zijn als AI-tools, zoals depressie van Chatzpt, Manus, kunnen het werk op het web autonoom breken om de informatie te krijgen die nodig is om het werk te voltooien. Wat het onderscheidt, is het venster “Manus ‘computer”, waardoor gebruikers niet alleen toestaan ​​om te observeren wat de agent doet, maar op elk moment interfereert.

Om het in het examen te houden, gaf ik Manus drie werken: ((( Uitvinders jonger dan 35 jaarEen lijst gemaakt door Overzicht van MIT -technologie Elk jaar

Hier is hoe het deed:

Taak 1: De eerste lijst met journalisten die me de eerste lijst met Manus gaven, heeft vijf namen, waaronder vijf “gerespecteerde referenties”. Ik heb gemerkt dat het sommige van de belangrijke taken van de journalisten heeft vermeld, niet anderen. Ik vroeg Manus waarom het het deed. Het was de reden dat de voorgestelde reden glimlachend eenvoudig was: het is lui geworden. De agent vertelde me dat het was: “Ik probeerde het onderzoeksproces te versnellen vanwege gedeeltelijke tijdsbeperkingen.” Toen ik benadrukte voor continuïteit en grondigheid, reageerde Manus op hun huidige uitlaatklep met een brede lijst met journalisten en vermeldde belangrijke banen. (Ik was blij om de snee te zien met mijn vele favoriete collega’s))

Ik was gefascineerd dat ik het hoogste niveau voor de verandering kon adviseren, alsof iemand een echte stagiair of assistent had zoals het was en vriendelijk had gereageerd. En wanneer het aanvankelijk de verandering in de status van sommige journalisten negeert, wanneer ik het vraag om enkele resultaten opnieuw te bezoeken, corrigeert het ze snel. En een geweldige functie: de uitvoer was downloadbaar als een woord- of Excel -bestand, het maakt het gemakkelijk om met anderen te bewerken of te delen.

Manus deed een snatch terwijl hij toegang heeft tot nieuwsartikelen van journalisten op de achterkant van de Pawals; Het staat vaak uit tegen het Captcha -blok. Omdat ik stap voor stap heb kunnen volgen, kan ik ze gemakkelijk accepteren, hoewel veel mediasites de apparatuur nog steeds hebben geblokkeerd vanwege verdachte activiteiten. Ik zie hier de mogelijkheid van grote verbetering – en het zal effectief zijn als een toekomstige versie van Manus actief hulp kan zoeken wanneer deze wordt geconfronteerd met dergelijke beperkingen.

Taak 2: Om het appartement te doorzoeken, gaf ik Manus een complex criterium met een budget en een brede keuken, buitenruimte, toegang tot het centrum van Manhatton en een groot treinstation in een wandeling van zeven minuten. Manus legde aanvankelijk vage vereisten uit zoals “sommige soorten buitentoegang”, in zeer letterlijk, exclusief het hele pand zonder persoonlijke terrassen of veranda -toegang. Na verdere begeleiding en verduidelijking was het echter in staat om een ​​brede en meer nuttige lijst samen te stellen door aanbevelingen te doen over lagen en nette opsommingstekens.

De uiteindelijke uitgang voelde rechtstreeks vanuit AftakkingOndertitels zoals “Best Overall”, “” Beste waarde “en” luxueuze opties “. Dit werk (inclusief de achterwaartse) duurde minder dan een half uur sneller dan de compilatie van journalisten (die meer dan een uur duurde), waarschijnlijk omdat de vastgoedlijsten openbaarder beschikbaar waren en online goed gestructureerd waren.

Taak 3: Dit is de grootste van de gelegenheid: ik vroeg Manus om dit jaar 55 mensen te nomineren onder de 35 -lijst met uitvinders. Deze lijst is een enorm initiatief om te produceren en we krijgen meestal elk jaar honderden nominaties. Dus ik was geïnteresseerd om te zien hoe goed Manus kon doen. Het brak dit werk in stappen, inclusief het beoordelen van eerdere lijsten, het maken van een zoekstrategie om de kandidaten te identificeren, de namen samen te stellen en verschillende selectie kandidaten over de hele wereld te bevestigen.

Het ontwikkelen van een zoekstrategie was de meeste tijd om de mensen te verbinden. Hoewel het zijn aanpak niet duidelijk schetste, heeft de computervenster van Manus de agent snel gepubliceerd via de websites van snel waardige onderzoeksuniversiteiten, snel aan technologische prijzen en nieuwsartikelen aangekondigd. Bij het proberen toegang te krijgen tot academische papers en -wald media -inhoud, werd dit echter opnieuw geconfronteerd.

Na het internet tot drie uur te hebben gebonden – Manus (begrijpelijkerwijs) vroeg me meerdere keren of ik de zoekopdracht kon beperken – het was alleen in staat om me drie kandidaten te geven met het hele achtergrondprofiel. Toen ik er opnieuw op drukte om de volledige lijst van 50 namen te geven, produceerde het uiteindelijk een, maar bepaalde academische instellingen en velden werden in grote hoeveelheden gepresenteerd, die een onvolledig onderzoeksproces weerspiegelen. Nadat ik de zaak had gericht en het had gevraagd om vijf kandidaten uit China te vinden, was het in staat om een ​​lijst met vijf energie samen te stellen, hoewel de resultaten neigden naar de Chinese media -lieveling. Uiteindelijk, na het waarschuwen van het systeem moest ik opgeven dat ik te veel moest opgeven om de tekst in te voeren, het acteren van Manus kon worden verminderd.

Mijn beoordeling: Algemeen, Ik heb Manus ontvangen als een zeer intuïtief hulpmiddel voor gebruikers met of zonder codering achtergronden. In twee van de drie banen leverde het betere resultaten op dan toen ik dezelfde taken presenteerde aan Chatzipt Depressark, hoewel het aanzienlijk meer tijd kostte om ze te voltooien. Manus lijkt het meest geschikt te zijn voor analytisch werk dat uitgebreid onderzoek naar het open internet vereist, maar er zijn beperkte kansen. Met andere woorden, het is het beste om vast te houden aan het soort werk dat kan worden gedaan tijdens een dag van bekwame menselijke stagiair.

Desondanks zijn het niet allemaal gladde boten. Manus kan vaak lijden aan crash en instabiliteit van het systeem en kan vechten als de grote delen van de tekst worden gevraagd om te verwerken. “Vanwege het huidige hoge service -lading” kan het bericht niet worden gemaakt. Probeer het een paar keer opnieuw op mijn scherm terwijl u nieuwe verzoeken start ”en af ​​en toe wordt de computer van Manus lang op een bepaalde pagina bevroren.

Het heeft een faalpercentage van meer dan chatzipt depressark – het probleem dat het team aanpakt, is een probleem, Overeenkomstig Kies G, de hoofdwetenschapper van Manus. Zei, Chinese media -outlet 36KR De taak van Manus rapporteert over $ 2, dat is slechts tien tentaal van de depressarkkosten. Als het MANUS-team de infrastructuur van zijn server versterkt, kan ik zien dat de apparatuur de gewenste keuze wordt voor afzonderlijke gebruikers, met name witte-boordende professionals, verschillende ontwikkelaars en kleine partijen.

Ten slotte denk ik dat het echt de moeite waard is dat het effectieve proces van Manus transparanter en samenwerkelijker aanvoelt. Het stelt actief vragen in de weg en houdt de oorspronkelijke instructies in zijn geheugen vast voor toekomstig gebruik als “kennis”, waardoor gemakkelijk aangepaste agentervaring mogelijk is. Het is echt geweldig dat elke sessie in staat is om opnieuw te spelen en te delen.

Ik hoop dat ik manus zal blijven gebruiken voor beide soorten werk in mijn persoonlijke en professionele leven. Hoewel ik niet zeker weet of de vergelijking met de dipsic vrij nauwkeurig is, fungeert het als een verder bewijs dat Chinese AI -bedrijven niet alleen hun westerse deel van de stappen volgen. Ze innoveren niet alleen in basismodellen, maar ook actief in de autonome AI -agenten zo groot.



Bronlink

Related Articles

Back to top button