Συσκευή με τεχνητή νοημοσύνη επιταχύνει την αμφίδρομη επικοινωνία για κωφάλαλα άτομα

Συσκευή με τεχνητή νοημοσύνη επιταχύνει την αμφίδρομη επικοινωνία για κωφάλαλα άτομα

Για να λειτουργήσει σωστά το σύστημα, είναι απαραίτητη μια ενεργή διαδικασία μετάδοσης και λήψης, όπως ακριβώς συμβαίνει φυσιολογικά κατά τη διάρκεια μιας συνομιλίας.

 Μια από τις μεγαλύτερες προκλήσεις για τα κωφάλαλα άτομα είναι η επικοινωνία, μια πραγματικότητα που ενέπνευσε μια ομάδα ερευνητών και φοιτητών Βιοϊατρικής Μηχανικής από την περιοχή της Πόλης του Μεξικού του Tec de Monterrey να αναπτύξουν μια πρωτοποριακή συσκευή. Το σχέδιό τους αποσκοπεί στη γεφύρωση αυτού του χάσματος με τη δημιουργία ενός εργαλείου που μεταφράζει τη γραφή Braille σε ομιλία και την ομιλία σε γραφή Braille.

Ο José Rubén Fuentes, ερευνητής στη Σχολή Μηχανικών και Επιστημών, εξηγεί ότι το πρωτότυπο που σχεδίασαν λειτουργεί όπως μια γραφομηχανή Braille, αλλά ενσωματώνει τεχνητή νοημοσύνη (AI) και εξειδικευμένο υλικό για να επιτρέψει την αμφίδρομη επικοινωνία σε πραγματικό χρόνο μεταξύ κωφάλαλων και ατόμων χωρίς αυτή την πάθηση.

"Το κείμενο που πληκτρολογείται στη μηχανή επεξεργάζεται από έναν αλγόριθμο τεχνητής νοημοσύνης και μετατρέπεται σε λέξεις που μπορούν να γίνουν εύκολα κατανοητές από ένα άλλο άτομο - στη συνέχεια διαβάζεται φωναχτά. Στο άλλο άκρο, ένα μικρόφωνο συλλαμβάνει τη φυσική ομιλία, αναγνωρίζει τη γλώσσα και τη μετατρέπει σε γραφή Braille", εξηγεί ο Fuentes.

Αυτή η καινοτομία έχει τη δυνατότητα να βελτιώσει σημαντικά την επικοινωνία και την κοινωνική ένταξη των κωφάλαλων ατόμων, καθιστώντας τη μάθηση πιο προσιτή και μειώνοντας τα ποσοστά εγκατάλειψης του σχολείου. Επιπλέον, η συσκευή προσφέρει ένα εναλλακτικό μέσο αλληλεπίδρασης σε χώρους όπως τα σχολεία, τα νοσοκομεία και οι επιχειρήσεις, ωφελώντας όχι μόνο την κοινότητα των κωφάλαλων αλλά και τους ηλικιωμένους με αισθητηριακές διαταραχές.

Σύμφωνα με μια παγκόσμια μελέτη της Παγκόσμιας Ομοσπονδίας Κωφάλαλων, τα παιδιά με αυτή την πάθηση έχουν έως και 23 φορές λιγότερες πιθανότητες να λάβουν εκπαίδευση σε σύγκριση με τους συνομηλίκους τους. Στην πραγματικότητα, οι πιθανότητες να φοιτήσουν στο σχολείο είναι κατά 15% χαμηλότερες από εκείνες των παιδιών με άλλες αναπηρίες. Στο Μεξικό, τα κωφάλαλα άτομα αποτελούν περίπου το 6% του πληθυσμού με αναπηρία - πάνω από 465.000 άτομα.

ai deafblind individuals1

Ο σχεδιασμός είναι ουσιαστικά ένα πληκτρολόγιο Braille με κινητήρες δόνησης τύπου κέρματος και πρόσθετα στηρίγματα χεριών. Αυτός ο σχεδιασμός επιλέχθηκε επειδή η διάταξη των πλήκτρων μοιάζει με αυτή μιας γραφομηχανής Braille, με στόχο την εξοικείωση του χρήστη. (Φωτογραφία: TecScience)

Αμφίδρομη επικοινωνία: Το πρωτότυπο αυτής της συσκευής εμπνεύστηκε από τη μηχανή Perkins, ένα εργαλείο που χρησιμοποιείται για τη γραφή Braille. Ωστόσο, οι παραδοσιακές γραφομηχανές Braille έχουν έναν σημαντικό περιορισμό - επιτρέπουν στους χρήστες να μοιράζονται πληροφορίες αλλά όχι να τις λαμβάνουν. Αυτή η πρόκληση οδήγησε τους ερευνητές στην ανάπτυξη μιας καινοτόμου λύσης.

Σχεδίασαν ένα τρισδιάστατα εκτυπωμένο σύστημα που ενσωματώνει έναν μίνι υπολογιστή χαμηλού κόστους (όπως ένα Raspberry Pi ή ένα BeagleBone), λογισμικό ανοικτού κώδικα βασισμένο σε Linux και μια ηλεκτρονική διεπαφή εξοπλισμένη με μικρόφωνο, ηχείο, μοτέρ δόνησης και επανασχεδιασμένη διάταξη πληκτρολογίου.

Οι παραδοσιακές γραφομηχανές Braille έχουν συνήθως 10 πλήκτρα, τα οποία μπορεί να είναι περιοριστικά για τα λατινικά αλφάβητα λόγω της έλλειψης ορισμένων γραμμάτων και συμβόλων. Για να το αντιμετωπίσει αυτό, η ομάδα πρόσθεσε πέντε επιπλέον πλήκτρα για τόνους, umlauts και γράμματα όπως το «ñ». Αυτά τα πλήκτρα τοποθετήθηκαν στρατηγικά για να διατηρήσουν την εργονομική άνεση, επιτρέποντας την ομαλή λειτουργία και με τα δύο χέρια.

Το σύστημα μετατρέπει το δακτυλογραφημένο κείμενο Braille σε γραπτή γλώσσα, η οποία στη συνέχεια μετατρέπεται σε ομιλία και αναπαράγεται μέσω ενός ηχείου, καθιστώντας την ακουστική για τους άλλους.

Για τη λήψη πληροφοριών, το σύστημα χρησιμοποιεί ένα μικρόφωνο για την καταγραφή της προφορικής γλώσσας. Επεξεργάζεται τον ήχο χρησιμοποιώντας έναν μαθηματικό μετασχηματισμό (μετασχηματισμός Fourier) και τον μετατρέπει σε φασματογράφημα - μια οπτική αναπαράσταση του ήχου. Αυτό το φασματογράφημα αναλύεται στη συνέχεια από έναν αλγόριθμο τεχνητής νοημοσύνης (ένα συνελικτικό νευρωνικό δίκτυο), ο οποίος ταξινομεί και ερμηνεύει τον ήχο σε κείμενο πριν από τη μετατροπή του σε Braille.

Μόλις το μήνυμα μετατραπεί, ο κωφάλαλος χρήστης μπορεί να το λάβει μέσω ενός απτικού συστήματος, δηλαδή δονήσεις με συγκεκριμένα μοτίβα που αντιστοιχούν σε χαρακτήρες Braille. Αυτές οι δονήσεις, που παράγονται από μικρούς κινητήρες, μπορούν να γίνουν αισθητές σε καθορισμένα σημεία της συσκευής. Επιπλέον, το μεταφρασμένο κείμενο Braille μπορεί να μετατραπεί ξανά σε ομιλία, επιτρέποντας στον αποστολέα να ακούσει και να επιβεβαιώσει το μήνυμα που μοιράστηκε.

«Καταργήσαμε την ανάγκη για χαρτί και περίπλοκες διαδικασίες, κάνοντας την επικοινωνία να μοιάζει πολύ πιο φυσική και αποτελεσματική», λέει ο Fuentes.

Αξιολόγηση της λειτουργικότητας του συστήματος
Παράλληλα, ερευνητές και φοιτητές εργάστηκαν τόσο στο λογισμικό όσο και στον φυσικό σχεδιασμό της συσκευής για την επιτυχή ενσωμάτωση της τεχνητής νοημοσύνης. Συνέλεξαν επίσης δείγματα ήχου και δεδομένα για να δημιουργήσουν ένα σύνολο λέξεων και να εκπαιδεύσουν τον αλγόριθμο.

Η βιοϊατρική μηχανική περιλαμβάνει επίσης πτυχές της εμβιομηχανικής, οπότε η ομάδα εξέτασε ανθρωπομετρικές μετρήσεις για να διασφαλίσει ότι η συσκευή είναι όσο το δυνατόν πιο άνετη για τους χρήστες. Τα πλήκτρα και οι κινητήρες δόνησης τοποθετήθηκαν έτσι ώστε να επιτρέπουν σε κωφάλαλα άτομα να αναγνωρίζουν εύκολα τα σύμβολα της γλώσσας Braille.

"Πραγματοποιήσαμε μια σειρά δοκιμών για να καθορίσουμε αν τα άτομα που δεν είναι φυσικοί χρήστες της γραφής Braille θα μπορούσαν να χειριστούν το εργαλείο με ευκολία. Φτάσαμε σε μια πιθανότητα άνω του 50% ότι οι χρήστες δεν θα έκαναν λάθη", εξηγεί ο Fuentes.

Κατά τη διάρκεια της διαδικασίας επικύρωσης και προσαρμογής του αλγορίθμου, συμμετείχαν τόσο μη εκπαιδευμένοι συμμετέχοντες -οι οποίοι δεν είχαν χρησιμοποιήσει ποτέ εργαλεία επικοινωνίας Braille- όσο και έμπειροι κωφάλαλοι χρήστες. Οι έμπειροι στη γραφή Braille πέτυχαν εντυπωσιακό ποσοστό ακρίβειας 95% έως 98% κατά τη χρήση του πληκτρολογίου.

Ο Fuentes τονίζει ότι για να λειτουργήσει αποτελεσματικά το σύστημα, απαιτείται μια ενεργή διαδικασία μετάδοσης και λήψης - με άλλα λόγια, ένα πραγματικό σύστημα αμφίδρομης επικοινωνίας, όπου η ομιλία και η ακρόαση συμβαίνουν φυσικά, όπως ακριβώς σε μια συζήτηση.

Επί του παρόντος, το σύστημα θεωρείται εργαλείο υποστήριξης και αναπτύσσεται σε επίπεδο τεχνολογικής ετοιμότητας (TRL) 5, που σημαίνει ότι υπάρχει ένα λειτουργικό πρωτότυπο που βρίσκεται σε φάση επικύρωσης. Υπάρχει επίσης δυνατότητα ενσωμάτωσης της δημιουργικής τεχνητής νοημοσύνης για την ενίσχυση της επικοινωνίας, την ελαχιστοποίηση των λαθών και την ενσωμάτωση ενός συστήματος αυτόματης διόρθωσης.

"Ο γενικός στόχος αυτού του έργου είναι να παράσχει ένα εργαλείο που μπορεί να κάνει πραγματική διαφορά για τα άτομα με αυτή την πάθηση. Αυτός είναι ο λόγος για τον οποίο χρησιμοποιούμε όσο το δυνατόν περισσότερους πόρους ανοιχτού κώδικα, με το όραμα να καταστήσουμε τελικά αυτή τη λύση ελεύθερα προσβάσιμη", προσθέτει.

 

Πηγή

TecScience


Εκτύπωση   Email