Η Google παρουσίασε το Dolphin Gemma, ένα πρωτοποριακό AI μοντέλο που βοηθά τους επιστήμονες να κατανοήσουν την επικοινωνία των δελφινιών. Δείτε πώς ανοίγει ο δρόμος για την πρώτη «συνομιλία» ανθρώπου-δελφινιού!
Το Dolphin Gemma, ένα μεγάλο γλωσσικό μοντέλο που ανέπτυξε η Google, βοηθά επιστήμονες να μελετήσουν πώς επικοινωνούν τα δελφίνια και, ενδεχομένως, να ανακαλύψουν και τι λένε.
Η Google παρουσίασε το DolphinGemma (14/4), ένα μοντέλο τεχνητής νοημοσύνης σχεδιασμένο να αναγνωρίζει τις φωνητικές εκφράσεις των δελφινιών και να δημιουργεί νέες, παρόμοιες ακολουθίες ήχων, σε συνεργασία με ερευνητές από το Georgia Tech και το Wild Dolphin Project (WDP).
Τα ρινοδέλφινα χρησιμοποιούν μοναδικά “σφυρίγματα υπογραφής” ως ατομικούς αναγνωριστικούς ήχους, παρόμοια με τα ονόματα στην ανθρώπινη επικοινωνία. Αυτά τα χαρακτηριστικά σφυρίγματα, που αναπτύσσονται νωρίς στη ζωή και επηρεάζονται από τη φωνητική μάθηση, παίζουν κρίσιμο ρόλο στη διατήρηση κοινωνικών δεσμών και της συνοχής της ομάδας. Το σφύριγμα υπογραφής κάθε δελφινιού έχει μοναδικό περίγραμμα συχνότητας, καθιστώντας το ιδιαίτερα διακριτό από τα άλλα και χρησιμοποιείται για εντοπισμό, επαφή μητέρας-μωρού και διευκόλυνση κοινωνικών αλληλεπιδράσεων.
Πολυετής μελέτη της κοινωνίας των δελφινιών
Από το 1985, το WDP μελετά το στικτό δελφίνι του Ατλαντικού – με στίγματα – [Atlantic spotted dolphins (Stenella frontalis)] στις Μπαχάμες. Με μη παρεμβατική προσέγγιση (στον κόσμο τους, με τους όρους τους), έχουν συγκεντρώσει έναν μοναδικό θησαυρό δεδομένων: δεκαετίες υποβρύχιων βίντεο και ήχων συνδεδεμένων με ταυτοποιημένα δελφίνια, τις ιστορίες ζωής και τις παρατηρημένες συμπεριφορές τους.
Οι ήχοι των δελφινιών έχουν συγκεκριμένες σημασίες:
- Μοναδικά σφυρίγματα (signature whistles, σφυρίγματα υπογραφής)
- “Squawks” σε καβγάδες
- “Buzzes” σε περιόδους ζευγαρώματος ή κυνηγιού καρχαριών
Η γνώση του ποιο δελφίνι παρήγαγε τον κάθε ήχο είναι κρίσιμη για την κατανόηση. Ο τελικός στόχος είναι η αποκάλυψη δομών που ίσως υποδεικνύουν ύπαρξη «γλώσσας».
Με βάση τις ηχογραφήσεις του WDP, το DolphinGemma εκπαιδεύεται για να αναγνωρίζει και να αναπαράγει ηχοακολουθίες. Χρησιμοποιεί την τεχνολογία SoundStream της Google για συμπίεση ήχου και επεξεργάζεται τα δεδομένα με αρχιτεκτονική παρόμοια με αυτή των γλωσσικών μοντέλων — αλλά για ήχο.
Το DolphinGemma αναγνωρίζει μοτίβα, επαναλαμβανόμενες ακολουθίες και μπορεί να αποκαλύψει πιθανά «νοήματα» — κάτι που μέχρι τώρα απαιτούσε τεράστια ανθρώπινη προσπάθεια. Στο μέλλον, με τη βοήθεια συνθετικών ήχων, ίσως αναπτυχθεί ένα κοινό λεξιλόγιο μεταξύ ανθρώπων και δελφινιών.
Το μοντέλο με περίπου 400 εκατομμύρια παραμέτρους είναι αρκετά μικρό ώστε να «τρέχει» απευθείας σε κινητά Pixel που χρησιμοποιούνται στην έρευνα στο πεδίο, αναφέρει η Google.
Η τεχνολογία CHAT για αλληλεπίδραση
Παράλληλα, το WDP και το Georgia Tech αναπτύσσουν το σύστημα CHAT (Cetacean Hearing Augmentation Telemetry), το οποίο προσπαθεί να αναπτύξει ένα κοινό «λεξιλόγιο» μεταξύ δελφινιών και ανθρώπων μέσω συνθετικών ήχων που συσχετίζονται με αντικείμενα που αρέσουν στα δελφίνια.
Το CHAT βασίζεται σε:
- Ανίχνευση μίμησης από τα δελφίνια
- Ταυτοποίηση του σφυρίγματος σε πραγματικό χρόνο
- Πληροφόρηση του ερευνητή για το «αίτημα» του δελφινιού
- Παροχή του αντίστοιχου αντικειμένου για ενίσχυση της σύνδεσης
Διαμοιρασμός του DolphinGemma με την επιστημονική κοινότητα
Η Google σχεδιάζει να διαθέσει το Dolphin Gemma ως ανοικτό μοντέλο το καλοκαίρι του 2025. Παρόλο που είναι εκπαιδευμένο για τα δελφίνια Stenella frontalis, θα μπορεί να προσαρμοστεί για άλλες φάλαινες και δελφίνια, μέσω fine-tuning.
Αυτή η επαναστατική τεχνολογία ανοίγει νέες δυνατότητες για την κατανόηση και την πιθανή αλληλεπίδραση με τα δελφίνια στο φυσικό τους περιβάλλον.
“Το ταξίδι για την κατανόηση της επικοινωνίας με τα δελφίνια είναι μακρύ, αλλά ο συνδυασμός της αφοσιωμένης επιτόπιας έρευνας από την WDP, της μηχανικής τεχνογνωσίας από την Georgia Tech και της δύναμης της τεχνολογίας της Google ανοίγει συναρπαστικές νέες δυνατότητες. Δεν ακούμε πια. Αρχίζουμε να καταλαβαίνουμε τα μοτίβα μέσα στους ήχους, ανοίγοντας το δρόμο για ένα μέλλον όπου το χάσμα μεταξύ της επικοινωνίας ανθρώπου και δελφινιού μπορεί να γίνει λίγο μικρότερο”, σημειώνει η Google.