Patronus Ai wil de rechter-beeld AI eerlijk houden en Etsy gebruikt het al

Luuk van der Plas13 maart 2025

8 4 minutes read

Word lid van onze dagelijkse en wekelijkse kranten voor exclusieve inhoud over de nieuwste updates en AI-dekking in de industrie. Leer meer

Mentor Vandaag heeft het aangekondigd wat het zegt bij de eerste multimodale grote taalmodel-e-a-a-a-judge (Mllm-a-judge) van de industrie, een tool is die is ontworpen om het AI-systeem te evalueren en het AI-systeem te evalueren dat de tekst produceert.

De nieuwe beoordelingstechniek is bedoeld om ontwikkelaars te helpen bij het detecteren en verminderen van problemen van hallucinaties en betrouwbaarheid in multimodale AI -toepassingen. E-commerce reuzen Ety Handgemaakte en vintage goederen hebben al technologie geïmplementeerd om de nauwkeurigheid van de bijschrift voor productbeelden in hun markt te verifiëren.

In een speciaal interview met VentureBeat zei de mede -oprichter van Patronous AI Anand Kannapan: “Super opgewonden dat ETS een van de klanten van ons schip is.” “Ze hebben miljoenen goederen op hun online marktplaats voor handgemaakte en oude producten die mensen wereldwijd maken. Een van de dingen die wilden kunnen kunnen profiteren van de generatieve AI voor hun AI-team, dit was de mogelijkheid om automatisch gegenereerde afbeelding bij te staan en ervoor te zorgen dat ze zich op hun hele wereldwijde gebruikersbasis bevinden, dat de bijschriften die produceren uiteindelijk correct zijn. ,,

Waarom Google’s Gemini de nieuwe AI -rechter kracht geeft in plaats van Openai

Patron maakte zijn eerste constructie Mllm-aa-a-judgegenaamd RechterOver het Gemini -model van Google na uitgebreid onderzoek met opties zoals GPT -4V van Openaii.

“We zijn verhuisd om te zien dat er een dunne prioriteit was voor egoïsme met GPT-4V, terwijl we zagen dat Mithun op die manieren minder bevooroordeeld was en een billijke aanpak om een verscheidenheid aan input-outputparen te kunnen beoordelen,” legde Kannappan uit. “Het werd gezien in uniform scoreverdeling in verschillende bronnen die hij zag.”

Het onderzoek van het bedrijf bereikte nog een verbluffend inzicht in multimodale evaluatie. In tegenstelling tot de evaluatie van tekst-cavalry, waarbij logica met meerdere stappen de prestaties vaak verbetert, verklaarde Kannappan dat het “meestal de MLLM-rechterprestaties niet verhoogt” voor beeldgebaseerde beoordeling.

Rechter De kant-en-klare beoordeling biedt het beeld bijschrift voor verschillende criteria, waaronder bijschriften hallucinaties, erkenning van primaire en niet-primaire objecten, nauwkeurigheid van objectlocaties en uitleg en tekstdetectie en analyse.

Beyond Retail: Hoe kunnen marketingteam en advocatenkantoren worden geprofiteerd van AI Image Evolution

Terwijl Ety Vertegenwoordigt een prominente klant in e-commerce, waarbij Patronus kijkt naar de toepassing die zich verder verspreidt dan de detailhandel.

Deze omvatten “marketingteams in bedrijven die over het algemeen ontwerpen, met name marketingontwerpen, maar willen details en bijschriften kunnen maken tegen nieuwe blokken in productontwerp,” zei Kannappan.

Hij benadrukte ook aanvragen voor ondernemingen die te maken hebben met documentaire verwerking: “Grote ondernemingen zoals Venture Services -bedrijven en advocatenkantoren kunnen meestal technische teams hebben die relatief erfgoedtechnieken gebruiken om verschillende soorten informatie van PDF te krijgen, zodat de materialen binnen grote documenten kunnen worden uitgesloten.”

Aangezien AI snel belangrijk wordt voor bedrijfsprocessen, worden veel bedrijven geconfronteerd met bundelig dilemma voor evaluatieapparaten. Kannappan stelt dat het uitbesteden van AI -beoordeling strategische en economische betekenis creëert.

“Omdat we met de teams hebben gewerkt (we hebben ontdekt dat) veel mensen ergens met kunnen beginnen, om te zien of ze iets intern kunnen ontwikkelen, en dan beseffen ze dat het één is, één, hun waarde prop of product is niet de kern voor het voorstel dat ze ontwikkelen. En twee, het is een zeer uitdagend probleem, het is een zeer uitdagend probleem, uit beide ai -perspectieven, maar ook uit de ai, maar ook van de afbeelding van de ai, maar ook van de afbeelding van de ai.

Dit wordt met name toegepast op het multimodale systeem, waar fouten op verschillende punten in het proces kunnen optreden. “Wanneer u werkt met voddensysteem of -agenten, of zelfs multimodale AI -systemen, zien we dat de mislukkingen plaatsvinden in alle delen van het systeem,” zei Kannappan.

Hoe Patronus van plan is om geld te verdienen door te concurreren met technische reuzen

Beschermheerus De aanbiedingen van verschillende prijsniveaus beginnend met een gratis optie, waarmee gebruikers kunnen experimenteren met platforms naar sommige volumegrenzen. Voor dat bereik kunnen klanten gaan voor het gebruik van de beoordelaar of aan het verkoopteam hechten voor bedrijfsregelingen met aangepaste functies en naaide prijzen.

Ondanks het gebruik van het Gemini -model van Google als basis, houdt de bedrijfsstichting zichzelf als een aanvulling in plaats van de modelaanbieders. Google,, Opening En antropisch,,

Kannapan zei: “We zien niet noodzakelijkerwijs de techniek die we maken of oplossingen maken die we als concurrenten maken met basisbedrijven, maar voor de toolcoat zijn zeer complementaire en extra nieuwe krachtige apparatuur die eindelijk mensen helpen betere LLM -systemen te ontwikkelen, zoals LLMS zei in protest.”

Audio -evaluatie die naar voren komt als Patronus het multimodale toezicht uitbreidt

De aankondiging van vandaag is een stap in de uitgebreide strategie van Patronus voor AI -evaluatie in verschillende soorten. Het bedrijf is van plan binnenkort verder te gaan dan afbeeldingen in audio -beoordeling.

“We zijn enthousiast omdat het de volgende fase is van onze visie op multimodaal, en vooral vandaag is gericht op afbeeldingen – en dan zijn we in de loop van de tijd enthousiast over wat we zullen doen, vooral met audio, vooral in de toekomst,” bevestigde Kannappan.

Deze routekaart past bij Kannappan die de “onderzoeksvisie van het bedrijf van schaalbaar toezicht” beschrijft – het ontwikkelen van de evaluatiemechanismen die gelijke tred kunnen houden met snel geavanceerde AI -systemen.

Hij zei: “We blijven nieuwe systemen, producten, raamwerk, methoden ontwikkelen, die uiteindelijk in staat zijn tot intelligente systemen, die we op de lange termijn als mensen willen oversite,” zei hij.

Omdat bedrijven kunnen rennen om het AI -systeem te implementeren dat afbeeldingen kan verklaren, tekst uit documenten kan halen en visuele materialen, risico op onnauwkeurigheid, hallucinaties en vooroordelen kan genereren. Patronous wedt dat naarmate het funderingsmodel verbetert, de uitdagingen van het evalueren van complexe multimodale AI-systemen-specifieke apparatuur speciale apparatuur vereist die kan vasten als eerlijke rechters van AI-output. In de wereld van High-Day of Commercial AI-boetes kunnen deze digitale juryleden waardevol blijken te zijn als modellen die ze evalueren.

Dagelijkse inzichten in zakelijke gebruiksscenario’s met VB dagelijks

Als je indruk wilt maken op je baas, heeft VB Daily je gedekt. We geven u de primeur in wat bedrijven doen met generatieve AI, van wettelijke wijzigingen tot praktische implementatie, zodat u inzicht kunt delen voor maximale ROI.

Lees ons privacybeleid

Bedankt voor het lidmaatschap. Bekijk hier meer VB -nieuwsbrieven.

Er was een fout.

Bronlink

Luuk van der Plas13 maart 2025

8 4 minutes read