De race om dierengeluiden in menselijke taal te vertalen
In 2025 zullen we zien dat AI en machinaal leren worden ingezet om echte vooruitgang te boeken in het begrijpen van de communicatie tussen dieren, waarmee een vraag wordt beantwoord die mensen al sinds ons bestaan voor een raadsel stelt: “Wat zeggen dieren tegen elkaar?” De recente Coller-Dolittle-prijsHet aanbieden van geldprijzen tot een half miljoen dollar aan wetenschappers die ‘de code kraken’ is een indicatie van een optimistisch vertrouwen dat de recente technologische ontwikkelingen op het gebied van machinaal leren en grote taalmodellen (LLM’s) dit doel binnen ons bereik brengen.
Veel onderzoeksgroepen werken al jaren aan algoritmen om dierengeluiden te begrijpen. Project Ceti heeft bijvoorbeeld de kliktreinen van potvissen en de liederen van bultruggen gedecodeerd. Deze moderne tools voor machinaal leren vereisen extreem grote hoeveelheden gegevens, en tot nu toe ontbraken dergelijke hoeveelheden hoogwaardige en goed geannoteerde gegevens.
Overweeg LLM’s zoals ChatGPT die trainingsgegevens tot hun beschikking hebben, waaronder de volledige tekst die op internet beschikbaar is. Dergelijke informatie over communicatie met dieren was in het verleden niet toegankelijk. Het is niet alleen zo dat de menselijke gegevenscorpora vele ordes van grootte groter zijn dan het soort gegevens waartoe we toegang hebben voor dieren in het wild: er werd meer dan 500 GB aan woorden gebruikt om GPT-3 te trainen, vergeleken met iets meer dan 8.000 ‘coda’s’. ” (of vocalisaties) voor Project Ceti’s recente analyse van potviscommunicatie.
Bovendien, als we met menselijke taal werken, doen we dat al weten wat er wordt gezegd. We weten zelfs wat een ‘woord’ is, wat een enorm voordeel is ten opzichte van het interpreteren van communicatie met dieren, waarbij wetenschappers zelden weten of een bepaald wolvengehuil bijvoorbeeld iets anders betekent dan een ander wolvengehuil, of zelfs of de wolven een gehuil als iets anders beschouwen. op de een of andere manier analoog aan een ‘woord’ in menselijke taal.
Desalniettemin zal 2025 nieuwe vooruitgang brengen, zowel in de hoeveelheid gegevens over diercommunicatie die wetenschappers ter beschikking staan, als in de soorten en kracht van AI-algoritmen die op die gegevens kunnen worden toegepast. Geautomatiseerde opname van dierengeluiden is binnen handbereik van elke wetenschappelijke onderzoeksgroep gekomen, waarbij goedkope opnameapparatuur zoals AudioMoth explosief in populariteit toeneemt.
Er komen nu enorme datasets online, omdat recorders in het veld kunnen blijven staan en kunnen luisteren naar de roep van gibbons in de jungle of vogels in het bos, 24/7, gedurende lange perioden. Er waren gevallen waarin dergelijke enorme datasets onmogelijk handmatig te beheren waren. Nu kunnen nieuwe automatische detectie-algoritmen, gebaseerd op convolutionele neurale netwerken, door duizenden uren aan opnames racen, de dierengeluiden eruit pikken en deze in verschillende typen clusteren, op basis van hun natuurlijke akoestische kenmerken.
Zodra deze grote dierdatasets beschikbaar zijn, worden nieuwe analytische algoritmen een mogelijkheid, zoals het gebruik van diepe neurale netwerken om verborgen structuren te vinden in reeksen dierlijke vocalisaties, die analoog kunnen zijn aan de betekenisvolle structuur in menselijke taal.
De fundamentele vraag die onduidelijk blijft, is echter: wat hopen we precies te doen met deze dierengeluiden? Sommige organisaties, zoals Interspecies.io, stelden hun doel heel duidelijk als: “signalen van de ene soort omzetten in coherente signalen voor een andere soort.” Met andere woorden: naar vertalen dierlijke communicatie in menselijke taal. Toch zijn de meeste wetenschappers het erover eens dat niet-menselijke dieren geen echte eigen taal hebben – althans niet op de manier waarop wij mensen taal hebben.
De Coller Dolittle Prize is iets geavanceerder en zoekt naar een manier “om te communiceren met of de communicatie van een organisme te ontcijferen.” Ontcijferen is een iets minder ambitieus doel dan vertalen, gezien de mogelijkheid dat dieren in feite geen taal hebben die vertaald kan worden. Tegenwoordig weten we niet hoeveel informatie, of hoe weinig, dieren onderling overbrengen. In 2025 zal de mensheid het potentieel hebben om ons begrip van niet alleen hoeveel dieren zeggen, maar ook wat ze precies tegen elkaar zeggen, te overstijgen.