
Σε σύνθετα περιβάλλοντα, οι άνθρωποι μπορούν να κατανοήσουν την έννοια του λόγου καλύτερα από το AI, επειδή χρησιμοποιούμε όχι μόνο τα αυτιά μας αλλά και τα μάτια μας.
Για παράδειγμα, βλέπουμε το στόμα κάποιου να κινείται και μπορεί να γνωρίζει διαισθητικά ότι ο ήχος που ακούμε πρέπει να προέρχεται από αυτό το άτομο.
Το Meta AI εργάζεται σε ένα νέο σύστημα διαλόγου AI, το οποίο είναι να διδάξει το AI να μάθει επίσης να αναγνωρίζει τις λεπτές συσχετίσεις μεταξύ αυτού που βλέπει και ακούει σε μια συζήτηση.
Το VisualVoice μαθαίνει με παρόμοιο τρόπο με τον τρόπο με τον οποίο οι άνθρωποι μαθαίνουν να κυριαρχούν νέες δεξιότητες, επιτρέποντας τον οπτικοακουστικό διαχωρισμό ομιλίας με την εκμάθηση οπτικών και ακουστικών ενδείξεων από μη επισημασμένα βίντεο.
Για τα μηχανήματα, αυτό δημιουργεί καλύτερη αντίληψη, ενώ η ανθρώπινη αντίληψη βελτιώνεται.
Φανταστείτε να είστε σε θέση να συμμετάσχετε σε ομαδικές συναντήσεις στο Metaverse με συναδέλφους από όλο τον κόσμο, ενώζοντας μικρότερες συναντήσεις ομάδων καθώς μετακινούνται μέσα από τον εικονικό χώρο, κατά τη διάρκεια του οποίου οι ήχοι ανεβαίνουν και timbres στη σκηνή, σύμφωνα με το περιβάλλον προσαρμόζονται ανάλογα.
Δηλαδή, μπορεί να αποκτήσει ταυτόχρονα πληροφορίες ήχου, βίντεο και κειμένου και έχει ένα πλουσιότερο μοντέλο περιβαλλοντικής κατανόησης, επιτρέποντας στους χρήστες να έχουν μια εμπειρία "πολύ wow".
Χρόνος δημοσίευσης: Ιουλ-20-2022