![Τεχνητή Νοημοσύνη: Με ποιο βιβλίο τα βρίσκει σκούρα;](https://www.ot.gr/wp-content/uploads/2023/05/biblos-in-1-scaled.jpg)
Σκούρα φαίνεται να τα βρίσκουν τα μοντέλα τεχνητής νοημοσύνης της Meta τα οποία «εκπαιδεύονται» με τη Βίβλο ώστε να αναγνωρίζουν και να παράγουν ομιλία για περισσότερες από 1.000 γλώσσες.
Η εταιρεία κυκλοφορεί τα νέα της μοντέλα γλώσσας μέσω της υπηρεσίας GitHub, έτσι ώστε οι προγραμματιστές που εργάζονται σε διαφορετικές γλώσσες να μπορούν να δημιουργήσουν νέες, πιο ποικίλες εφαρμογές ομιλίας.
Τεχνητή Νοημοσύνη: Κινέζος νομπελίστας έγραψε την ομιλία του με τη βοήθεια του ChatGPT
Τα νέα μοντέλα εκπαιδεύτηκαν σε δύο σύνολα δεδομένων: ένα που περιέχει ηχογραφήσεις της Καινής Διαθήκης σε 1.107 γλώσσες και ένα άλλο που περιέχει ηχογραφήσεις -χωρίς κατηγοριοποίηση- της Καινής Διαθήκης σε 3.809 γλώσσες.
Στην συνέχεια, η ομάδα επεξεργάστηκε τον ήχο ομιλίας και τα δεδομένα κειμένου για να βελτιώσει την ποιότητά του προτού εκτελέσει έναν αλγόριθμο σχεδιασμένο να ευθυγραμμίζει τις ηχογραφήσεις με το συνοδευτικό κείμενο. Η διαδικασία επανελήφθη με έναν δεύτερο αλγόριθμο εκπαιδευμένο στα πρόσφατα ευθυγραμμισμένα δεδομένα. Με αυτή τη μέθοδο, οι ερευνητές μπόρεσαν να διδάξουν τον αλγόριθμο να μαθαίνει μια νέα γλώσσα πιο εύκολα, ακόμη και χωρίς το συνοδευτικό κείμενο.
Η εταιρεία ελπίζει τώρα ότι αυτοί οι αλγόριθμοι θα βοηθήσουν στη διατήρηση γλωσσών που κινδυνεύουν να εξαφανιστούν.
7.000 γλώσσες περιμένουν
Οι ερευνητές ισχυρίζονται τώρα ότι τα μοντέλα τους μπορούν να συνομιλούν σε περισσότερες από 1.000 γλώσσες, αλλά αναγνωρίζουν περισσότερες από 4.000.
Ωστόσο, υπάρχουν 7.000 γλώσσες παγκοσμίως τις οποίες δεν «καλύπτει» όλρε το εργαλείο της Meta. Αυτό συμβαίνει επειδή αυτού του είδους τα μοντέλα τείνουν να απαιτούν τεράστιες ποσότητες δεδομένων εκπαίδευσης με κατηγοριοποίηση, τα οποία είναι διαθέσιμα μόνο για έναν μικρό αριθμό γλωσσών, συμπεριλαμβανομένων των Αγγλικών, Ισπανικών και Κινέζων.
«Μπορούμε να χρησιμοποιήσουμε αυτό που έμαθε αυτό το μοντέλο για να κατασκευάσουμε γρήγορα συστήματα ομιλίας με πολύ, πολύ λίγα δεδομένα», δήλωσε ο Michael Auli, ερευνητής στη Meta που εργάστηκε στο έργο. «Για τα αγγλικά, έχουμε πολλά καλά σύνολα δεδομένων και τα έχουμε για μερικές ακόμη γλώσσες, αλλά απλώς δεν τα έχουμε για γλώσσες που ομιλούνται, ας πούμε, από 1.000 άτομα».
Επιπλέον, σε σύγκριση με μοντέλα από άλλες εταιρείες, συμπεριλαμβανομένου του OpenAI Whisper, η έκδοση του Meta είχε το μισό ποσοστό σφαλμάτων, παρόλο που κάλυπτε 11 φορές περισσότερες γλώσσες.
Το πρόβλημα με τη Βίβλο
Ωστόσο, η ομάδα προειδοποιεί ότι το μοντέλο εξακολουθεί να κινδυνεύει να μεταγράψει λάθος ορισμένες λέξεις ή φράσεις, κάτι που θα μπορούσε να οδηγήσει σε ανακριβείς ή δυνητικά προσβλητικές ετικέτες.
Αναγνωρίζουν επίσης ότι τα μοντέλα αναγνώρισης ομιλίας τους απέδωσαν περισσότερες μεροληπτικές λέξεις από άλλα μοντέλα, αν και μόνο 0,7% περισσότερες.
Αν και το εύρος της έρευνας είναι εντυπωσιακό, η χρήση θρησκευτικών κειμένων για την εκπαίδευση μοντέλων τεχνητής νοημοσύνης μπορεί να είναι αμφιλεγόμενη, λέει ο Chris Emezue, ερευνητής στο Masakhane, έναν οργανισμό που εργάζεται στην επεξεργασία φυσικής γλώσσας για αφρικανικές γλώσσες, ο οποίος δεν συμμετείχε στο πρότζεκτ της Meta. «Η Βίβλος έχει πολλές μεροληψίες και παραποιήσεις», λέει.
Με πληροφορίες από MIT Technology Review
Πηγή: in.gr
![ot.gr](/wp-content/themes/whsk_otgr/common/imgs/fav.ico/favicon-32x32.png)
![ot.gr](/wp-content/themes/whsk_otgr/common/imgs/fav.ico/favicon-32x32.png)
Latest News
![OpenAI: Κηρύττει τον πόλεμο στην Google – Λανσάρει μηχανή αναζήτησης με στόχο την πίτα των 175 δισ.](https://www.ot.gr/wp-content/uploads/2024/07/OPENAI-scaled-1-600x400.jpg)
Κηρύττει τον πόλεμο στην Google η OpenAI – Λανσάρει μηχανή αναζήτησης με στόχο την πίτα των 175 δισ.
Το πειραματικό προϊόν, γνωστό ως SearchGPT αποτελεί το νέο «όπλο» της OpenAI - Με ποιο τρόπο θα γίνονται οι αναζητήσεις
![Τεχνητή Νοημοσύνη: Μοντέλα AI της Google «πήραν» ασημένιο μετάλλιο στη Διεθνή Μαθηματική Ολυμπιάδα 2024](https://www.ot.gr/wp-content/uploads/2023/03/2023-03-14T130758Z_1436153338_RC2FUY97WIM6_RTRMADP_5_GOOGLE-AI-600x400.jpg)
Τεχνητή Νοημοσύνη: Μοντέλα AI της Google «πήραν» ασημένιο μετάλλιο στη Διεθνή Μαθηματική Ολυμπιάδα 2024
Τα μοντέλα Τεχνητής Νοημοσύνης AlphaProof και AlphaGeometry 2 έλυσαν τέσσερα από τα έξι προβλήματα που τους τέθηκαν
![Τεχνητή νοημοσύνη: Τι είναι το «data wall» και πώς μπορεί να την επηρεάσει](https://www.ot.gr/wp-content/uploads/2024/04/ot_ai1-600x352.png)
Τί είναι το «data wall» και πώς μπορεί να την επηρεάσει την ανάπτυξη της τεχνητής νοημοσύνης
Η τεχνητή νοημοσύνη «τρέχει» με πολύ γρήγορους ρυθμούς όμως η έλλειψη δεδομένων μπορεί να φρενάρει την ανάπτυξή της
![Ιλον Μασκ: Θέλει να γεμίσει τα εργοστάσια με ανθρωποειδή ρομπότ [γράφημα]](https://www.ot.gr/wp-content/uploads/2024/07/ot_Musk_Robot_optimus-600x352.png)
Ο Μασκ θέλει να γεμίσει τα εργοστάσια με ανθρωποειδή ρομπότ [Γράφημα]
O Ιλον Μασκ πιστεύει ότι το Optimus θα μπορεί από το 2025 να έχει εξελιχθεί τόσο ώστε να μπορεί να εκτελεί εργασίες βιομηχανικής παραγωγής
![Μασκ: Τα χαμηλότερα κέρδη για την Tesla και η καθυστέρηση στα «ρομποταξί»](https://www.ot.gr/wp-content/uploads/2024/07/2024-06-11T210046Z_1335884131_RC2FK1A1S7OG_RTRMADP_5_OPENAI-MUSK-600x400.jpg)
Τα χαμηλότερα κέρδη για την Tesla του Μασκ και η καθυστέρηση στα «ρομποταξί»
Οι μετοχές πέφτουν παρά τον ισχυρισμό του Μασκ ότι τα σχέδια για τον «αυτόνομο στόλο» θα μεταμορφώσουν την αγοραστική αξία της εταιρείας
![Τεχνητή νοημοσύνη: Η πρωτοκαθεδρία των ΗΠΑ και οι σοσιαλιστικές αξίες της Κίνας](https://www.ot.gr/wp-content/uploads/2023/02/ot_artificial23-600x352.png)
Η πρωτοκαθεδρία των ΗΠΑ στην ΑΙ και οι σοσιαλιστικές αξίες της Κίνας
Οι ΗΠΑ πρωτοπορούν και ξοδεύουν για ΑΙ
![Τεχνητή νοημοσύνη: Έως το 2025 πραγματικότητα οι AI «εργάτες» που θα μιλούν μεταξύ τους](https://www.ot.gr/wp-content/uploads/2024/04/ot_ai2-600x352.png)
AI «εργάτες» που θα μιλούν μεταξύ τους έρχονται το 2025
Τι προβλέπει η εταιρεία παροχής τεχνολογικών υπηρεσιών Capgemini
![Τεχνητή νοημοσύνη: Η Google εκπαιδεύει το ελληνικό Δημόσιο](https://www.ot.gr/wp-content/uploads/2024/07/2024-07-17T151912Z_2045698199_RC2Q56AG2GX0_RTRMADP_5_BRITAIN-TECH-REGULATION-600x375.jpg)
Η Google εκπαιδεύει το ελληνικό Δημόσιο στην AI
Το πρόγραμμα της Google ξεκίνησε με 500 δημοσίους υπαλλήλους και θα επεκταθεί από τον Σεπτέμβριο σε όλες τις δημόσιες υπηρεσίες.
![Nvidia: Επέλαση στην κινεζική αγορά με νέο AI chip](https://www.ot.gr/wp-content/uploads/2024/02/ot_nvidia1-600x352.png)
Με νέο AI chip επελαύνει στην κινεζική αγορά η Nvdia
Η Nvidia αποκάλυψε τον περασμένο Μάρτιο τη σειρά chip «Blackwell», η οποία πρόκειται να παραχθεί μαζικά αργότερα μέσα στο έτος
![AI στην υπηρεσία του Ισλαμικού Κράτους](https://www.ot.gr/wp-content/uploads/2023/12/artificial-768x487-1-600x380.jpg)
AI στην υπηρεσία του Ισλαμικού Κράτους
Ο κόσμος της Τεχνητής Νοημοσύνης είναι συναρπαστικός, αλλά και επικίνδυνος - Aνησυχία προκαλεί η μαζική χρήση της από εξτρεμιστές για προπαγάνδα και παραπληροφόρηση