Mistrale uitgaven Nieuwe optische karakterherkenning (OCR) API die wereldwijd topprestaties claimt

Word lid van onze dagelijkse en wekelijkse kranten voor exclusieve inhoud over de nieuwste updates en AI-dekking in de industrie. Leer meer
Nou -gefinancierde Franse AI -startup Mistral Er is materiaal om op je eigen manier te gaan.
In een zee van competitieve logische modellen heeft het bedrijf geïntroduceerd Mistral OCREen nieuwe optische karakterherkenning (OCR) API is ontworpen om geavanceerde documentonderzoeksmogelijkheden te bieden.
De API verwijdert het materiaal – inclusief handgeschreven notities, getypte lessen, afbeeldingen, tabellen en vergelijkingen – van afbeeldingen met ongewapende PDF en hoge nauwkeurigheid, gepresenteerd in een gestructureerd formaat, van afbeeldingen.
Gestructureerde gegevens zijn informatie die op een vooraf bepaalde manier wordt uitgevoerd, meestal met behulp van rijen en kolommen, waardoor het gemakkelijker te ontdekken en te analyseren is. Gemeenschappelijke voorbeelden zijn namen, adressen en financiële transacties die zijn opgeslagen in de database of spreadsheet.
Onnodige gegevens daarentegen ontbreekt een specifiek formaat of structuur, waardoor het uitdagender wordt om te verwerken en te analyseren. Deze categorie bevat een breed scala aan gegevenstypen, zoals e -mail, berichten op sociale media, video’s, foto’s en audiobestanden. Aangezien onnodige gegevens niet netjes passen in de traditionele database, worden speciale apparatuur en technieken, zoals natuurlijke taalverwerking (NLP) en machine learning (ML), vaak gebruikt om zinvol inzicht te extraheren.
Inzicht in het verschil tussen deze gegevenstypen is belangrijk voor bedrijven om hun informatieactiva effectief te beheren en ten goede te komen.
Voor het begrijpen van documenten met meertalige ondersteuning, snelle verwerkingssnelheid en integratie met grote taalmodellen (LLM), wordt Mistral OCR ingezet om organisaties te helpen hun documentatie voor te bereiden.
Gezien het feit dat – het aankondigen van de nieuwe API volgens de blogpost van Mistral – 90% van alle commerciële informatie overbodig is, moet de nieuwe API een grote zegen hebben voor organisaties om te digitaliseren en te catalogi om uw gegevens te digitaliseren voor gebruik in API AI -toepassing of interne/externe kennisbasis.
Mistral zet een nieuwe gouden standaard voor OCR
Het doel van Mistral OCR is beter hoe organisaties het proces en complexe documenten analyseren.
In tegenstelling tot traditionele OCR -oplossingen, die voornamelijk gericht zijn op tekstextractie, is Mistral OCR ontworpen om verschillende documenten -typografische elementen en tekens te interpreteren, waaronder tabellen, wiskundige manifestaties en geïnterleviseerde afbeeldingen, met behoud van een gestructureerde output.
Volgens Mistral Chief Science Officer Guelume Lamp vormt deze techniek een belangrijke stap in de richting van bredere AI -acceptatie in ondernemingen, vooral voor bedrijven die de toegang tot hun interne documenten willen vereenvoudigen.
De API is al geïntegreerd in LE -chat, die afhankelijk zijn van miljoenen gebruikersdocumentverwerking.
Nu kunnen ontwikkelaars en bedrijven modellen gebruiken via LA -platform, het ontwikkelaarspak van Mistral.
De API zal naar verwachting ook beschikbaar zijn via wolken en infectiepartners en zal on-rims perineogen aanbieden voor organisaties met een hoge beschermingseisen.
Een vroege (70 jaar) computertechnologie voeden
OCR -technologie speelt al tientallen jaren een belangrijke rol in automatische data -extractie en documentdigitalisering. De eerste commerciële OCR -machine werd in de jaren 1950 ontwikkeld door David Shepard en zijn medewerkers Harvey en William Lales Junior, die het Intelligent Machine Research Company (IMR) oprichtten om technologie op de markt te brengen.
Toen de Digest van de lezers de eerste grote klant werd, kreeg het systeem grip, gevolgd door banken, telecombedrijven zoals AT&T en Major Oil Firm.
In 1959 heeft IBM IMR -octrooien in licentie gegeven en zijn OCR -machine geïntroduceerd, die het woord vormen als een standaard van de industrie.
Sindsdien is OCR -technologie blijven ontwikkelen, waarbij AI en ML worden opgenomen om de nauwkeurigheid te verbeteren, taalondersteuning uit te breiden en snelle complexe documentformaten af te handelen en kan worden gevonden in zulke grote venture -software als PDF -lezers. Adobe Acrobat,,
Mistral OCR vertegenwoordigt de volgende fase in deze ontwikkeling, omdat deze eenvoudige tekst gebruik maakt van AI om het begrip van het document te vergroten zonder herkenning.
Benchmarks tonen de kracht van mistral ocr
Mistral benadrukte het concurrentievoordeel van zijn OCR op bestaande tools onder vermelding van benchmark-tests, waar het belangrijke opties verbeterde, waaronder Google-documenten AI, Azure OCR en GPT-4O van OpenAI.
Het model behaalde de hoogste nauwkeurigheidsscores in wiskundeherkenning, gescande documenten en meertalige tekstverwerking.
Mistral OCR is ook ontworpen om sneller te werken dan concurrerende modellen en is in staat tot 2.000 pagina’s per minuut op een knooppunt te verwerken.
Dit snelheidsvoordeel is geschikt voor het verwerking van documenten met een groot volume in industrieën zoals onderzoek, klantenservice en historische bescherming.
Sophia Yang, hoofd van ontwikkelaarsrelaties in Mistral is gedaan Actieve prestaties OCR -mogelijkheden op zijn X -account. In het bijzonder benadrukte hij zijn prestatiebenchmarks op het hoogste niveau, meertalige ondersteuning en het vermogen om wiskundige vergelijkingen nauwkeurig uit PDF te extraheren.
Één in Post onlangsHij deelde een voorbeeld van mistral OCR om complexe wiskundige manifestaties met succes te identificeren en op te formatteren, waardoor de effectiviteit ervan voor wetenschappelijke en academische toepassingen werd versterkt.
Gebruik belangrijke functies en cases
Mistral OCR introduceert veel kenmerken die het een veelzijdig hulpmiddel maken voor bedrijven en instellingen die een grote documentenrepository afhandelen:
- Meertalig en multimodale verwerking: Het model ondersteunt een breed scala aan talen, scripts en documentenlay -outs, waardoor het nuttig is voor wereldwijde outfits. Yang stond op deze mogelijkheid, noemde het een game-wisselaar voor meertalige documentverwerking.
- Gestructureerde output en documentatie van urinebescherming: In tegenstelling tot het basis OCR -model formuleert de Mistral OCR elementen zoals de koptekst, paragrafen, lijsten en tabellen, zodat het extract nuttiger is voor de les stroomafwaartse toepassingen.
- Document-as-prompt en gestructureerde output: Gebruikers kunnen specifieke materialen verwijderen en opmaken in een gestructureerde output, zoals JSON of Markdown, waardoor integratie met andere AI-gedreven workflows mogelijk wordt.
- Zelfhosting-optie: Organisaties met strikte gegevensbeveiliging en compliance -vereisten kunnen MIRTRAL OCR in hun eigen infrastructuur implementeren.
De Mistral AI -ontwikkelaar Documentatie online Benadrukt de mogelijkheden die de vaardigheden buiten OCR begrijpen. Na het verwijderen van de tekst en de structuur is de Mistral OCR geïntegreerd met LLM, waardoor gebruikers kunnen communiceren met het documentmateriaal met behulp van vragen van natuurlijke taal. Deze faciliteit maakt het mogelijk:
- Antwoord over specifiek documentmateriaal;
- Automatische informatie -extractie en samenvatting;
- Vergelijkende analyse in veel documenten;
- Referentie-in-credeerbare reacties die het volledige document overwegen.
Moeten ondernemingsbeslissers op de hoogte zijn van Mistral OCR
Voor CEO’s, CIO’s, CTO’s, IT-managers en teamleiders, biedt de Mistral OCR belangrijke kansen voor efficiëntie, veiligheid en schaalbaarheid in document-bediende workflows.
1. Verhoging van efficiëntie en kostenbesparingen
Door de documentverwerking en het verminderen van handmatige gegevensinvoer te automatiseren, snijdt Mistral OCR op administratieve overhead en stroomlijnen bewerkingen. Organisaties kunnen grote versies van documenten verwerken met een snelle en hoge nauwkeurigheid, waardoor de behoefte aan menselijke tussenkomst wordt verminderd. Het is met name waardevol voor industrieën zoals financiën, gezondheidszorg, juridische en compliance, waarbij breed papierwerk een hindernis is.
2. AI-productie toename van de besluitvorming
De mogelijkheid om het document van Mistral OCR te begrijpen, stelt de besluitvormers in staat om actabele inzichten te halen uit rapporten, contracten, financiële documenten en onderzoeksdocumenten. IT-leiders kunnen API’s integreren in een business intelligence-platform, dat AI-geassisteerde documentanalyse mogelijk maakt die snelle, gegevensaangedreven besluitvorming ondersteunen.
3. Gegevensbeveiliging en naleving verbeteren
Met onvoldoende perineogene opties, voldoet de Mistral OCR aan de veiligheids- en nalevingsvereisten van ondernemingen die gevoelige of geclassificeerde gegevens verwerken. CIO- en compliance -functionarissen kunnen ervoor zorgen dat de eigendomsinformatie binnen de interne infrastructuur blijft en gebruik maakt van AI voor documentverwerking.
4. Spontane integratie met enterprise workflows
CTO’s en IT-managers kunnen MILTRAL OCR integreren met bestaande bedrijfssystemen, waaronder materiaalbeheerplatforms, CRM-software, juridische technische oplossingen en AI-gerunde assistenten. De API-ondersteuning voor gestructureerde output (JSON, Markdown) maakt het gemakkelijk om documentgebaseerde workflows te automatiseren, waardoor de algehele productiviteit wordt verbeterd.
5. Concurrentievoordeel door AI-innovatie-innovatie
Voor organisaties die verder willen blijven in digitale veranderingen, biedt MILTRAL OCR een schaalbare AI-geopereerde oplossing om de enorme documentrepository toegankelijker te maken. Door gebruik te maken van AI voor informatie -extractie, kunnen ondernemingen klantervaringen vergroten, zich aanpassen aan interne kennisterreinen en de bedrijfsstoornissen verminderen.
Prijzen en beschikbaarheid
De prijs van mistrale OCR is 1.000 pagina’s per $ 1, met batchschattingen $ 1 per 2.000 pagina’s per 2.000 pagina’s.
De API is nu beschikbaar op het LA -platform en is in de nabije toekomst de uitbreiding van mistralschema’s voor wolken en intrance partners. Het model is ook gratis om de website van Mistral te proberen KatEen intellectuele chatbot stelt gebruikers in staat om hun vaardigheden te testen voordat ze in hun workflows worden geïntegreerd, beheerd door hun LLM en vergelijkbaar met de chat van Opena. Verwacht wordt dat Mistral AI het model continu zal verbeteren op basis van de gebruikersrespons in de komende weken.
Toen ik het kort op een kleine handgeschreven (en rommelige) opmerking op een stuk papier testte, bood het in minder dan een tweede keer een nauwkeurige, gestructureerde tekstlijn terug.


Wat gebeurt er daarna?
Met Mistral OCR blijft Mistral AI zijn pak van AI-aangedreven apparatuur uitbreiden, zich richten op ondernemingen, waarvoor oplossingen voor het verwerken van document met hoge disperatie nodig zijn.
AI- Door de OCR te integreren met een begripvolle documentgezicht, stelt Mistral bedrijven in staat om hun documenten op intelligentere manieren te extraheren, te analyseren en te communiceren.
Enterprise-leiders, ontwikkelaars en IT-teams kunnen MILTRAL OCR detecteren via LA-platform of on-presidenties perineogen kunnen aanvragen voor speciale use-cases.
Ontwikkelaars kunnen ook controleren Documentatie van Mistral AI Om te beginnen met Mistral-CoR-Latest.
Bronlink