Τεχνητή Νοημοσύνη: Με ποιο βιβλίο τα βρίσκει σκούρα;

Οι ερευνητές ισχυρίζονται ότι τα εργαλεία τους μπορούν να συνομιλούν σε περισσότερες από 1.000 γλώσσες

Tεχνητή νοημοσύνη 25.05.2023, 20:29

Τεχνητή Νοημοσύνη: Με ποιο βιβλίο τα βρίσκει σκούρα;

Newsroom

Σκούρα φαίνεται να τα βρίσκουν τα μοντέλα τεχνητής νοημοσύνης της Meta τα οποία «εκπαιδεύονται» με τη Βίβλο ώστε να αναγνωρίζουν και να παράγουν ομιλία για περισσότερες από 1.000 γλώσσες.

Η εταιρεία κυκλοφορεί τα νέα της μοντέλα γλώσσας μέσω της υπηρεσίας GitHub, έτσι ώστε οι προγραμματιστές που εργάζονται σε διαφορετικές γλώσσες να μπορούν να δημιουργήσουν νέες, πιο ποικίλες εφαρμογές ομιλίας.

Τεχνητή Νοημοσύνη: Κινέζος νομπελίστας έγραψε την ομιλία του με τη βοήθεια του ChatGPT

Τα νέα μοντέλα εκπαιδεύτηκαν σε δύο σύνολα δεδομένων: ένα που περιέχει ηχογραφήσεις της Καινής Διαθήκης σε 1.107 γλώσσες και ένα άλλο που περιέχει ηχογραφήσεις -χωρίς κατηγοριοποίηση- της Καινής Διαθήκης σε 3.809 γλώσσες.

Στην συνέχεια, η ομάδα επεξεργάστηκε τον ήχο ομιλίας και τα δεδομένα κειμένου για να βελτιώσει την ποιότητά του προτού εκτελέσει έναν αλγόριθμο σχεδιασμένο να ευθυγραμμίζει τις ηχογραφήσεις με το συνοδευτικό κείμενο. Η διαδικασία επανελήφθη με έναν δεύτερο αλγόριθμο εκπαιδευμένο στα πρόσφατα ευθυγραμμισμένα δεδομένα. Με αυτή τη μέθοδο, οι ερευνητές μπόρεσαν να διδάξουν τον αλγόριθμο να μαθαίνει μια νέα γλώσσα πιο εύκολα, ακόμη και χωρίς το συνοδευτικό κείμενο.

Η εταιρεία ελπίζει τώρα ότι αυτοί οι αλγόριθμοι θα βοηθήσουν στη διατήρηση γλωσσών που κινδυνεύουν να εξαφανιστούν.

7.000 γλώσσες περιμένουν

Οι ερευνητές ισχυρίζονται τώρα ότι τα μοντέλα τους μπορούν να συνομιλούν σε περισσότερες από 1.000 γλώσσες, αλλά αναγνωρίζουν περισσότερες από 4.000.

Ωστόσο, υπάρχουν 7.000 γλώσσες παγκοσμίως τις οποίες δεν «καλύπτει» όλρε το εργαλείο της Meta. Αυτό συμβαίνει επειδή αυτού του είδους τα μοντέλα τείνουν να απαιτούν τεράστιες ποσότητες δεδομένων εκπαίδευσης με κατηγοριοποίηση, τα οποία είναι διαθέσιμα μόνο για έναν μικρό αριθμό γλωσσών, συμπεριλαμβανομένων των Αγγλικών, Ισπανικών και Κινέζων.

«Μπορούμε να χρησιμοποιήσουμε αυτό που έμαθε αυτό το μοντέλο για να κατασκευάσουμε γρήγορα συστήματα ομιλίας με πολύ, πολύ λίγα δεδομένα», δήλωσε ο Michael Auli, ερευνητής στη Meta που εργάστηκε στο έργο. «Για τα αγγλικά, έχουμε πολλά καλά σύνολα δεδομένων και τα έχουμε για μερικές ακόμη γλώσσες, αλλά απλώς δεν τα έχουμε για γλώσσες που ομιλούνται, ας πούμε, από 1.000 άτομα».

Επιπλέον, σε σύγκριση με μοντέλα από άλλες εταιρείες, συμπεριλαμβανομένου του OpenAI Whisper, η έκδοση του Meta είχε το μισό ποσοστό σφαλμάτων, παρόλο που κάλυπτε 11 φορές περισσότερες γλώσσες.

Το πρόβλημα με τη Βίβλο

Ωστόσο, η ομάδα προειδοποιεί ότι το μοντέλο εξακολουθεί να κινδυνεύει να μεταγράψει λάθος ορισμένες λέξεις ή φράσεις, κάτι που θα μπορούσε να οδηγήσει σε ανακριβείς ή δυνητικά προσβλητικές ετικέτες.

Αναγνωρίζουν επίσης ότι τα μοντέλα αναγνώρισης ομιλίας τους απέδωσαν περισσότερες μεροληπτικές λέξεις από άλλα μοντέλα, αν και μόνο 0,7% περισσότερες.

Αν και το εύρος της έρευνας είναι εντυπωσιακό, η χρήση θρησκευτικών κειμένων για την εκπαίδευση μοντέλων τεχνητής νοημοσύνης μπορεί να είναι αμφιλεγόμενη, λέει ο Chris Emezue, ερευνητής στο Masakhane, έναν οργανισμό που εργάζεται στην επεξεργασία φυσικής γλώσσας για αφρικανικές γλώσσες, ο οποίος δεν συμμετείχε στο πρότζεκτ της Meta. «Η Βίβλος έχει πολλές μεροληψίες και παραποιήσεις», λέει.

Με πληροφορίες από MIT Technology Review

Πηγή: in.gr

Σχόλια

OT Originals

Motor Oil: Υγιή τα αποτελέσματα, ελκυστικό το μέρισμα, λέει η AΧΙΑ – Alpha

Business 24.03.2026, 09:37

ΑΧΙΑ - Alpha: Υγιή τα αποτελέσματα της Motor Oil - Ελκυστικό το μέρισμα

Oι τομείς Ενέργειας & Φυσικού Αερίου της Motor Oil εκτιμάται ότι θα ενισχύσουν περαιτέρω τη συνεισφορά τους στην κερδοφορία του ομίλου

Αλεξάνδρα Τόμπρα

Κατώτατος μισθός: Κλειδώνει την Πέμπτη η νέα αύξηση – Το επικρατέστερο σενάριο

Εργασιακά – Ασφαλιστικά 24.03.2026, 07:00

«Κλειδώνει» την Πέμπτη o κατώτατος μισθός - Πού θα φτάσει

Συνεδριάζει το υπουργικό Συμβούλιο για τον κατώτατο μισθό - θα επηρεάσει άμεσα περίπου 650.000 εργαζομένους στον ιδιωτικό τομέα

Κώστας Παπαδής

Ελληνικές τράπεζες: Ισχυρή κερδοφορία και δείκτες πάνω από την Ευρώπη – Πώς μπαίνουν στη νέα κρίση

Τράπεζες 24.03.2026, 07:00

Με «ασπίδα»... κερδοφορίας μπαίνουν στη νέα κρίση οι τράπεζες

Οι ελληνικές τράπεζες καταγράφουν καλύτερες επιδόσεις σε σχέση με το μέσο όρο των πιστωτικών ιδρυμάτων που εποπτεύει ο SSM

Αγης Μάρκου

Καύσιμα: Αρκούν τα μέτρα της κυβέρνησης; – Πάνω από 2 ευρώ η βενζίνη

Economy 24.03.2026, 07:00

Αρκούν τα μέτρα για να σβήσουν την ακρίβεια του πολέμου;

Η επίδραση των επιδοτήσεων για την ακρίβεια στα καύσιμα - Τα δημοσιονομικά περιθώρια

Αλέξανδρος Κλώσσας

Ξενοδοχειακές επενδύσεις: Ελλάδα και Αθήνα στους πρωταθλητές της Ευρώπης το 2025 [πίνακες]

Τουρισμός 24.03.2026, 07:00

Πρωταθλητές στα ξενοδοχειακά deals Ελλάδα και Αθήνα [πίνακες]

Στα 1,119 δισ. ευρώ οι συναλλαγές στην Ελλάδα και 663 εκατ. στην Αθήνα – Ισχυρή ζήτηση και επενδυτικό ενδιαφέρον

Λάμπρος Καραγεώργος

Citi: Πώς θα επηρεαστούν Allwyn και Jumbo από το νέο πακέτο στήριξης 300 εκατ. στην Ελλάδα

Business 24.03.2026, 08:21

Οι επιπτώσεις του πακέτου στήριξης των 300 εκατ. σε Allwyn και Jumbo

Το πακέτο στήριξης όπως λέει η Citi αναμένεται να χρηματοδοτηθεί εν μέρει από την επιβολή φόρου σε διαδικτυακά παιχνίδια τύπου «καζίνο»

Αλεξάνδρα Τόμπρα

Ακίνητα: Περιζήτητα τα πολυτελή [πίνακες]

Ακίνητα 24.03.2026, 07:00

Περιζήτητα τα πολυτελή ακίνητα [πίνακες]

Το αγοραστικό ενδιαφέρον για πολυτελή ακίνητα τροφοδοτείται τόσο από το εξωτερικό όσο και από την Ελλάδα

Ανδρομάχη Παύλου

Καύσιμα: Γιατί η κυβέρνηση επιλέγει επιδοτήσεις αντί για μείωση φόρου

Economy 24.03.2026, 07:00

Fuel Pass vs ΕΦΚ - Γιατί η κυβέρνηση αποφεύγει τη μείωση φόρου

Η επιλογή της κυβέρνησης για την ακρίβεια στα καύσιμα και τι σημαίνει για τις τιμές στην αντλία

Αθανασία Ακρίβου

Περισσότερα από Tεχνητή νοημοσύνη

Tεχνητή νοημοσύνη 24.03.2026, 12:30

ΕΥ: Το AI επιταχύνει τον μετασχηματισμό του κλάδου τεχνολογίας το 2026

Οι 10 βασικές ευκαιρίες για τις εταιρείες τεχνολογίας το 2026

Τεχνητή νοημοσύνη: Υποχρεωτική εισφορά για την αποζημίωση των δημιουργών

Tεχνητή νοημοσύνη 23.03.2026, 23:25

Πώς μπορούν να αποζημιώνονται οι δημιουργοί AI

Πρόταση για την ίδρυση ευρωπαϊκού Ταμείου επενδύσεων για την στήριξη της καινοτομίας και του πολιτισμού με φόντο την τεχνητή νοημοσύνη

Αλέξανδρος Καψύλης

AI: Ξαναγράφει τους κανόνες της παραδοσιακής αναζήτησης

Tεχνητή νοημοσύνη 23.03.2026, 22:35

Ξεχάστε το Google search - Η AI ξαναγράφει τους κανόνες της αναζήτησης

Η νίκη στον πόλεμο των μηχανών αναζήτησης δεν εξαρτάται πλέον από τις λέξεις-κλειδιά - Ο ρόλος της AI

Αλεξάνδρα Παπαδημητρίου

FedEx: Εκπαίδευση τεχνητής νοημοσύνης σε πάνω από 400.000 εργαζόμενους

Tεχνητή νοημοσύνη 23.03.2026, 06:08

Η Fed εxεκπαδεύει όλους τους εργζομένους σε ΑΙ

Η FedEx έχει αναλάβει μια πρωτοβουλία για την εκμάθηση της τεχνητής νοημοσύνης σε σχεδόν μισό εκατομμύριο υπαλλήλους της σε όλο τον κόσμο

Τεχνητή Νοημοσύνη: Τα λάθη της ανησυχούν περισσότερο από τις απώλειες θέσεων εργασίας

Tεχνητή νοημοσύνη 22.03.2026, 23:57

Τι τρομάζει τους χρήστες της ΑΙ

Η έρευνα της Anthropic σε 80.000 χρήστες του Claude παρέχει λεπτομερή εικόνα του πώς οι άνθρωποι χρησιμοποιούν την τεχνητή νοημοσύνη

Data centers: Η έλλειψη επαρκούς ασφαλιστικής κάλυψης αποθαρύνει τους επενδυτές

World 22.03.2026, 23:16

Χωρίς επαρκή ασφάλιση οι επενδύσεις στα data centers

Γιγαντιαία συγκροτήματα data centers, όπως το Hyperion της Meta που βρίσκεται υπό κατασκευή στη Λουιζιάνα, είναι ιδιαίτερα υποασφαλισμένα

OpenAI: Μαζικές προσλήψεις και στροφή στις επιχειρήσεις για να καλύψει το χαμένο έδαφος

Tεχνητή νοημοσύνη 21.03.2026, 16:00

Η OpenAI πατά γκάζι και διπλασιάζει το προσωπικό της

Η OpenAI επιταχύνει δυναμικά την ανάπτυξή της, επενδύοντας σε προσωπικό και εταιρικές λύσεις για να ανταγωνιστεί την Anthropic

Νατάσα Σινιώρη

Allwyn: Ολοκληρώνει την συνένωση με ΟΠΑΠ

Η Allwyn επιβεβαιώνει την πρόθεσή της να προχωρήσει στη διανομή ποσού €0,80 ανά μετοχή

Παραπλανητικά SMS: Νέα απάτη με στόχο αυτή τη φορά το Fuel Pass 2026

Κοινωνία 24.03.2026, 18:05

Παραπλανητικά SMS για το Fuel Pass - Πώς θα προστατευτείτε

Mε παραπλανητικά SMS επιτήδειοι επιχειρούν να εξαπατήσουν πολίτες και να υποκλέψουν προσωπικά ή τραπεζικά στοιχεία

Παπαθανάσης: Πενήντα εκατ. ευρώ από το ΕΣΠΑ για το «Παράγουμε στην Ελλάδα»

Economy 24.03.2026, 17:43

Πενήντα εκατ. ευρώ στις επιχειρήσεις: Νέα δράση ΕΣΠΑ με επιδότηση έως 55%

Ο Νίκος Παπαθανάσης ανακοινώνει νέα δράση ΕΣΠΑ 50 εκατ. ευρώ για μικρομεσαίες επιχειρήσεις με στόχο την ενίσχυση της παραγωγής και της απασχόλησης

Economy 24.03.2026, 17:40

ΕΦΚΑ: Χλιδάτη ζωή για τα μέλη του κυκλώματος που εξαπατούσε το Δημόσιο

Συνολικά 31 εκατ. ευρώ έχασε ο ΕΦΚΑ από την απάτη του κυκλώματος που συνελήφθη από το ελληνικό FBI

Νίκος Κλόκας

Χρηματιστήριο Αθηνών: Με βουτιά 2% συνέχισε η αγορά το ρόλερ κόστερ

Xρηματιστήριο Αθηνών 24.03.2026, 17:32

Με βουτιά 2% συνέχισε το ΧΑ το ρόλερ κόστερ

Οι επενδυτές εμφανίζονται ιδιαίτερα διστακτικοί στη σκιά των γεωπολιτικών εξελίξεων και της αυριανής αργίας

Αλεξάνδρα Τόμπρα

Μανουσάκης (ΑΔΜΗΕ): Η διάρκεια του πολέμου απειλή για τις τιμές στο ρεύμα – Η άμυνα στην Ελλάδα

Ηλεκτρισμός 24.03.2026, 17:18

Μανουσάκης: Η απειλή του πολέμου για το ρεύμα - Η άμυνα στην Ελλάδα

Ο Μάνος Μανουσάκης πρόεδρος και CEO του ΑΔΜΗΕ υπογραμμίζει τις επιπτώσεις από την αύξηση του φυσικού αερίου - ΑΠΕ και ηλεκτρικές διασυνδέσεις κρατούν χαμηλά τις τιμές στο ρεύμα

Χρήστος Κολώνας