Nieuws

Een model richt zich op Global Enterprises met een nieuw zeer meertalige opdracht dat slechts 2 GPU’s vereist


Word lid van onze dagelijkse en wekelijkse kranten voor exclusieve inhoud over de nieuwste updates en AI-dekking in de industrie. Leer meer


Canadese AI Startup KOHere – medeopgericht door een van de auteurs van de originele Transformer -paper, die vandaag – vandaag – de Big Language Model (LLM) Revolution Klapt. Onthulde commando aHet nieuwste generatieve AI -model is ontworpen voor bedrijfstoepassingen.

Als opvolger van Command-R, die in maart 2024 begon, en opdracht R+ vervolgens, richt zich op de Retriel-E-Mement Generation (RAG) op commando een build a build, externe apparatuurgebruik en onderneming AI bekwaam in relatie tot een vaardigheid en gespecialiseerde berekening en de snelheid waarmee het het antwoord dient.

Dit gaat een aantrekkelijke optie zijn voor ondernemingen die AI -voordelen willen krijgen zonder de bank te breken, en voor aanvragen waar vroege reacties vereist zijn – zoals financiën, gezondheid, geneeskunde, wetenschap en rechten.

Met hoge snelheid, lage hardwarevereisten en uitgebreide meertalige vaardigheden, beveelt de GPT-4 en DIPSEC-V3-Klasse LLM een positie als een sterk alternatief voor modellen zoals LLM, niet de nieuwe logische modellen die recent de AI-industrie hebben ingenomen.

In tegenstelling tot zijn voorganger, die een referentiedlengte van 128.000 tokens ondersteunde (kan in een input/output-uitwisseling worden behandeld, verwijzend naar de hoeveelheid LLM-informatie, over het equivalent van een 300-hit roman), waardoor de algehele efficiëntie en de bereidheid van ondernemingen, 256.000 token (gelijk aan 600 pagina’s van tekst) de referentielengte verbeterden.

Het komt ook op de Heels-coheir voor de non-profit dochteronderneming van het bedrijf van het bedrijf deze maand om een ​​open-source uit te geven genaamd Aya Vision (alleen voor onderzoek) meertalig visional vision-model.

Een stap met command-ar

Toen de Command-R begin 2024 werd gelanceerd, introduceerde het grote innovaties zoals aangepaste dag-prestaties, betere kennis herstellen en goedkope AI-implementatie.

Het verkreeg tractie met ondernemingen, geïntegreerd in commerciële oplossingen van bedrijven zoals Oracle, Dharna, Scale AI, Excent en Macinesce, echter echter November 2024 Meld Menlo Ventures Survey Enterprise Adoption Bewaar een marktaandeel tussen ondernemingen op een slanke 3%onder kleine startups zoals Openiai (34%), antropisch (24%) en zelfs mistral (5%).

Nu, in een poging om een ​​grote venture -trekking te worden, duwt het commando deze mogelijkheden verder. Volgens KOHere, dit:

  • Match of beter presteren dan Openai’s GPT-4O en Deepsek-V3 in Business, STEM en CODING Works
  • Slechts twee GPU (A100 of H100) werken, een belangrijke efficiëntieverbetering in vergelijking met een model dat vereist is door 32 GPU
  • Rapid token ontvangt generatie, produceert 156 tokens per seconde-1,75x sneller dan GPT-4O en 2,4x snel diepgaand dan Deep-V3
  • 7.460ms voor GPT-4O en 6.500ms met tijd van tijd tot token, vergeleken met 14.740ms voor Deepseek-V3, vermindert de vertraging,
  • Meertalige AI versterkt de mogelijkheden, met een beter Arabisch dialect en met uitgebreide ondersteuning voor 23 wereldwijde talen.

Notities erover Ontwikkelaar Document online Hij: “Commando is een mat. Standaard is het model interactief en aangepast aan interactie, wat betekent dat het actie is en Markdown gebruikt om de code te markeren. Om dit gedrag te negeren, moeten ontwikkelaars een preambule gebruiken die het model alleen vraagt ​​om antwoorden te geven en niet om de markeringen van de markdown of codeblokken te gebruiken. ,,

Onderneming

COLHERE zet zijn enterprise-first-strategie voort met Command A, ervoor zorgen dat het oorspronkelijk is geïntegreerd in een commerciële omgeving. Grote kenmerken zijn onder meer:

  • Geavanceerde herstel-omgekeerde generatie (RAG): Ondernemerlijke verificatie voor toepassingen maakt reacties met hoge compatibiliteit mogelijk
  • Gebruik van agentapparatuur: Voer de Enterprise Tool in en ondersteunt complexe workflows
  • Northern AI -platformintegratie: CoHere’s North AI werkt met platforms, waardoor bedrijven taken kunnen automatiseren met behulp van veilige AI-agenten van enterprise-grade.
  • Schaalbaarheid en kostenefficiëntie: Particuliere implementatie is goedkoper met maximaal 50% dan API-gebaseerde toegang.

Meertalig en hoge prestaties in het Arabisch

Een opvallend kenmerk van Command A heeft de mogelijkheid om nauwkeurige reacties te genereren in 23 van de meest gesproken talen wereldwijd, inclusief een betere behandeling in Arabische dialecten. Ondersteunde talen (volgens Ontwikkelaardocument op de website van COLHERE) Zijn:

  • Engels
  • Frans
  • Spaans
  • Italiaans
  • Duits
  • Portugees
  • Japani
  • Koreaans
  • Suiker
  • Arabisch
  • Russisch
  • Pools
  • Turks
  • Vietnamees
  • Nederlands
  • Rekening
  • Indonesisch
  • Oekraïens
  • Roemeense
  • Grieks
  • Hindi
  • Joods
  • Perzisch

In benchmarkbeoordeling:

  • De 98,2%nauwkeurigheid Command-Deepsek-V3 (94,9%) en GPT-4O (92,2%) in het reageren op Engelse signalen in het Arabisch.
  • Dit verbeterde de deelnemers in de dialectstabiliteit en scoorde een ADI2-score van 24,7 vergeleken met 15,9 (GPT-4O) en 15,7 (DeepSEK-V3).
Credit: Coere

Gemaakt voor snelheid en efficiëntie

Speed ​​Enterprise AI is een belangrijke factor voor Permans, en commando A is ontworpen om snellere resultaten te geven dan de vele concurrenten.

  • Snelheid van tokenstreaming voor 100K referentieverzoeken: 73 tokens/seconde (38/seconde bij GPT-4O en DeepSEK-V3 op 32/seconde)
  • Snelle eerste tokengeneratie: respons vermindert de tijd aanzienlijk in vergelijking met andere grootschalige modellen

Prijzen en beschikbaarheid

Command A is nu beschikbaar Cohair platform Met Zichtgewicht voor het gebruik van onderzoek om alleen het gezicht te knuffelen onder Creative Commons Atribution Non Commercial 4.0 International (CC-BY-NC 4.0) licentieUitgebreide cloudprovider ondersteuning binnenkort.

  • Input Token: $ 2,50 per miljoen
  • Output token: $ 10,00 per miljoen

Persoonlijk en op voorbereiding Purinogeen zijn op het verzoek beschikbaar.

Reacties in de industrie

Veel AI -onderzoekers en teamleden hebben hun enthousiasme gedeeld voor commando A.

Dwarkanath Ganeson, die in KOHER was, gaf commentaar op X: “De afgelopen maanden zijn we erg enthousiast om het werk te onthullen dat we hebben gedaan! Command A is geweldig. Slechts 2 H100 kan worden ingezet op GPU! 256k referentielengte, uitgebreide meertalige ondersteuning, gebruik van agenthulpmiddelen … is er erg trots op. ,,

KOHERE AI -onderzoeker Pierre Richemond zei: “Commando A is ons nieuwe GPT -4 O/Deepsek V3 -niveau, het Open -Vets 111B -model speelt een 256K -referentielengte die is aangepast aan efficiëntie in bedrijfsgebruik.”

Constructie op de basis van het commando-R, het commando van de KOHere vertegenwoordigt de volgende fase in de kostengeschoolde Enterprise AI.

Met een snelle snelheid, een groot referentvenster, betere meertalige behandeling en lage -financieringskosten, biedt het bedrijven een krachtige optie voor het bestaande AI -model.



Bronlink

Related Articles

Geef een reactie

Je e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *

Back to top button