
Στις φωνητικές δυνατότητες της τεχνητής νοημοσύνης της Meta επενδύει ο Μαρκ Ζάκερμπεργκ φέτος, καθώς ο γίγαντας των social media προωθεί τα σχέδια για τη δημιουργία εσόδων από την ταχέως αναπτυσσόμενη τεχνολογία.
Η Meta σχεδιάζει να εισαγάγει βελτιωμένες λειτουργίες φωνής στο πιο πρόσφατο μοντέλο ανοιχτού κώδικα μεγάλης γλώσσας, το Llama 4, που αναμένεται τις επόμενες εβδομάδες, είπαν πηγές στους Financial Times, καθώς στοιχηματίζουν ότι οι μελλοντικοί «πράκτορες» που υποστηρίζονται από AI θα είναι συνομιλητές και δεν θα χρειάζεται η συναλλαγή με κείμενο.
Η εταιρεία έχει επικεντρωθεί ιδιαίτερα στο να κάνει τη συνομιλία μεταξύ ενός χρήστη και του φωνητικού του μοντέλου πιο κοντά σε έναν αμφίδρομο φυσικό διάλογο, επιτρέποντας παύσεις από τον χρήστη και όχι μια πιο άκαμπτη μορφή ερωτήσεων και απαντήσεων, είπε μια πηγή.
Η έμφαση στην φωνητική λειτουργία έρχεται καθώς ο Ζάκερμπεργκ, έχει περιγράψει τολμηρά σχέδια να κάνει την αξίας $1,7 τρισεκατομμυρίων δολαρίων εταιρεία της Silicon Valley «αρχηγό της τεχνητής νοημοσύνης», αποκαλώντας το 2025 έτος make-or-break για πολλά από τα προϊόντα τεχνητής νοημοσύνης της, καθώς ο όμιλος αγωνίζεται ενάντια σε ανταγωνιστές όπως η OpenAI, η Microsoft και η Google για την εμπορευματοποίηση της τεχνολογίας.
Πώς θα αποκομίσει κέρδος
Αυτό οδήγησε την εταιρεία να εξετάσει τις δοκιμαστικές συνδρομές premium για τον βοηθό τεχνητής νοημοσύνης της Meta AI, για εργασίες όπως κρατήσεις και δημιουργία βίντεο, είπαν δύο άτομα στους FT. Εξετάζει επίσης το ενδεχόμενο εισαγωγής πληρωμένων διαφημίσεων, ή αναρτήσεων με χορηγία, στα αποτελέσματα αναζήτησης του βοηθού τεχνητής νοημοσύνης της.
Ο Ζάκερμπεργκ αποκάλυψε φέτος τα σχέδια για την κατασκευή ενός βοηθού μηχανικής τεχνητής νοημοσύνης που έχει τις ικανότητες κωδικοποίησης και επίλυσης προβλημάτων σε επίπεδο μηχανικού μεσαίου επιπέδου, ο οποίος, όπως είπε, έχει μια δυνητικά «πολύ μεγάλη αγορά».
Την Τετάρτη, ο Chief Product Officer του ομίλου, Κρις Κοξ, ανέλυσε ορισμένα από τα σχέδιά του για το Llama 4, λέγοντας ότι θα ήταν ένα «omni μοντέλο όπου η ομιλία θα ήταν “εγγενής”… αντί να μεταφράζει τη φωνή σε κείμενο, να στέλνει κείμενο στο LLM, να βγάζει κείμενο και να το μετατρέπει ξανά σε ομιλία».
Μιλώντας στο συνέδριο τεχνολογίας, μέσων και τηλεπικοινωνιών της Morgan Stanley, πρόσθεσε: «Πιστεύω ότι είναι τεράστια υπόθεση για το προϊόν διεπαφής, η ιδέα ότι μπορείς να μιλήσεις στο Διαδίκτυο και απλώς να το ρωτήσεις οτιδήποτε. Νομίζω ότι ακόμα προσπαθούμε να κατανοήσουμε το πόσο ισχυρό είναι αυτό».
Η Meta έχει επίσης συζητήσει τα προστατευτικά «κιγκλιδώματα» που πρέπει να έχει το νεότερο μοντέλο Llama σχετικά με το τι μπορεί να αποδώσει και αν θα τα χαμηλώσει.
Πληθώρα ανταγωνιστών αντιμετωπίζει η Meta
Οι συζητήσεις έρχονται εν μέσω ενός πλήθους νέων προϊόντων από ανταγωνιστές και προειδοποιήσεων από τον νεοδιορισμένο «τσάρο της AI» Ντέιβιντ Σακς, επενδυτή της Silicon Valley, ο οποίος έχει πει ότι θέλει να διασφαλίσει ότι τα μοντέλα τεχνητής νοημοσύνης των ΗΠΑ δεν είναι πολιτικά προκατειλημμένα ή «woke».
Η OpenAI κυκλοφόρησε τη δική της λειτουργία φωνής πέρυσι και επικεντρώθηκε στο να του δώσει ξεχωριστές προσωπικότητες, ενώ το Grok 3, που δημιουργήθηκε από το xAI του Ίλον Μασκ και διατίθεται στην πλατφόρμα X, παρουσίασε τις λειτουργίες φωνής του σε επιλεγμένους χρήστες στα τέλη του περασμένου μήνα.
Το μοντέλο του Μασκ, Grok, σχεδιάστηκε ειδικά για να έχει λιγότερα προστατευτικά κιγκλιδώματα, συμπεριλαμβανομένης μιας «ασταθούς λειτουργίας» που σκόπιμα ανταποκρίνεται με τρόπους που προορίζονται να είναι «απαράδεκτοι, ακατάλληλοι και προσβλητικοί», σύμφωνα με την εταιρεία.
Η Meta αποκάλυψε πέρυσι μια λιγότερο «ηθικολογική» έκδοση του μοντέλου της AI για την τρίτη έκδοση Llama, μετά από κριτική ότι το Llama 2 αρνιόταν να απαντήσει σε αθώες ερωτήσεις.
Το να επιτρέπεται στους χρήστες να αλληλεπιδρούν με έναν βοηθό τεχνητής νοημοσύνης χρησιμοποιώντας φωνητικές εντολές είναι ένα σημαντικό χαρακτηριστικό των έξυπνων γυαλιών Ray-Ban της Meta, τα οποία έχουν γίνει πρόσφατα μεγάλη επιτυχία μεταξύ των καταναλωτών. Ο όμιλος έχει επιταχύνει τα σχέδιά του για την κατασκευή ελαφρών ακουστικών που μπορούν να υποσκελίσουν το smartphone ως την κύρια υπολογιστική συσκευή των καταναλωτών.


Latest News

Δασκαλάκης: Πρόκληση η αλληλεπίδραση μηχανών με ανθρώπους
Ο καθηγητής του MIT, Κωνσταντίνος Δασκαλάκης, μίλησε για την τεχνητή νοημοσύνη, τις προοπτικές αλλά και τις προκλήσεις γύρω από την ανάπτυξή της

Η Baidu λάνσαρε δύο νέα μοντέλα ΑΙ και υπιστηρίζει ότι είναι ανταγωνιστικά της DeepSeek
Η Baidu δήλωσε ότι το τελευταίο μοντέλο βάσης ERNIE 4.5 έχει «εξαιρετική ικανότητα πολυτροπικής κατανόησης»

Data Center: Ποιος θα πληρώσει το ενεργειακό κόστος; – Τι αποκαλύπτει έρευνα του Harvard
Το ενεργειακό κόστος για τα data center πρέπει να μειωθεί -Θα το πληρώσουν οι καταναλωτές δείχνει το Harvard

ASML: Η μάχη που θα κρίνει το μέλλον της τεχνητής νοημοσύνης – Ο ανταγωνισμός από Κίνα και Ιαπωνία
Το να καταφέρει ένας ανταγωνιστής να προσπεράσει την ASML δεν είναι εύκολη υπόθεση όμως Κίνα και Ιαπωνία κάνουν σημαντικά βήματα

OpenAI και Μασκ συμφωνούν σε γρήγορη δίκη για αλλαγή μοντέλου λειτουργίας της startup
Ο δικαστής απέρριψε αυτό το μήνα το αίτημα του Μασκ να αναστείλει τη μετάβαση της OpenAI σε κερδοσκοπικό μοντέλο

Salesforce: Νέες δυνατότητες ενσωμάτωσης αυτόνομων AI Agents στις επιχειρήσεις
Η Salesforce ανακοίνωσε την κυκλοφορία του Agentforce 2dx, της νεότερης έκδοσης της πλατφόρμας Agentforce

Η Κίνα βάζει στο στόχαστρο τα fake news στο χρηματιστήριο λόγω ΑΙ
Οι ρυθμιστικές αρχές στην Κίνα θα «χτυπήσουν νωρίς, θα χτυπήσουν σκληρά και θα χτυπήσουν στην καρδιά» του ζητήματος

Ποια κατηγορία AI «φέρνει» έσοδα 57 δισ. δολ. τα επόμενα τρία χρόνια
Σύμφωνα με την μελέτη της Juniper, προβλέπεται ότι τα έσοδα αυτά, θα προέλθουν από τα οφέλη της ενσωμάτωσης AI Agents στις διάφορες υπηρεσίες

Πώς η τεχνητή νοημοσύνη αλλάζει για τα καλά τα logistics - Ο ρόλος των ρομπότ
Η πολυεθνική εταιρεία logistics DHL χρησιμοποιεί τη ρομποτική και την τεχνητή νοημοσύνη στις αποθήκες της

Προχωρά την ανάπτυξη των δικών της AI μικροτσίπ η Meta Platforms
Η Meta Platforms έχει ξεκινήσει μια μικρή παραγωγή του τσιπ και σχεδιάζει να την αυξήσει για χρήση σε ευρεία κλίμακα, αν η δοκιμή πάει καλά