Microsoft: Μελετά τεχνητή νοημοσύνη που κατανοεί εικόνες και ήχους

Η Microsoft μελετά ένα νέο μοντέλο τεχνητής νοημοσύνης που κατανοεί εικόνες και λύνει οπτικά παζλ

Tεχνητή νοημοσύνη 02.03.2023, 23:41

Microsoft: Μελετά τεχνητή νοημοσύνη που κατανοεί εικόνες και ήχους

Newsroom

Η Microsoft προχώρησε μέσω μίας μελέτης στα αποκαλυπτήρια ακόμη ενός μοντέλου τεχνητής νοημοσύνης, του Kosmos-1, ενός MLLM (multimodal large language model), το οποίο μπορεί όχι μόνο να ανταποκρίνεται σε γλωσσικές προτροπές αλλά και σε οπτικές ενδείξεις, οι οποίες μπορούν να χρησιμοποιηθούν για μια σειρά εργασιών, όπως η δημιουργία λεζάντας εικόνων, η οπτική απάντηση ερωτήσεων, κι άλλα.

Το ChatGPT της OpenAI βοήθησε στη διάδοση της έννοιας των LLM, όπως το μοντέλο GPT (Generative Pre-trained Transformer) και τη δυνατότητα μετατροπής μιας προτροπής κειμένου ή μιας εισαγωγής σε ένα ολοκληρωμένο τελικό κείμενο.

Ο Ίλον Μασκ ετοιμάζεται να δημιουργήσει τον αντίπαλο του ChatGPT

Όπως υποστηρίζουν οι ερευνητές τεχνητής νοημοσύνης της Microsoft, τα LLM εξακολουθούν να διερευνούν πολλαπλές μορφές περιεχομένου επεξεργασίας, όπως μηνύματα εικόνας και ήχου.

Σύμφωνα με τα όσα αναφέρονται στην μελέτη «Language Is Not All You Need: Aligning Perception with Language Models» η συγκεκριμένη πολυμορφική αντίληψη θεωρείται απαραίτητη για να αποκτήσει η τεχνητή γενική νοημοσύνη (AGI) δυνατότητες που θα μοιάζουν με το ChatGPT.

«Το πιο σημαντικό, το ξεκλείδωμα της πολυτροπικής εισόδου περιεχομένου διευρύνει σημαντικά τις εφαρμογές των μοντέλων γλώσσας σε τομείς υψηλής αξίας, όπως η πολυτροπική μηχανική εκμάθηση, η ευφυΐα εγγράφων και η ρομποτική», αναφέρει η μελέτη.

Η Microsoft λέει ότι το Kosmos-1 MLLM της μπορεί να αντιλαμβάνεται γενικές μεθόδους, να ακολουθεί οδηγίες (μηδενική εκμάθηση) και να μαθαίνει από τα συμφραζόμενα (εκμάθηση με λίγες λήψεις). «Ο στόχος είναι να ευθυγραμμιστεί η αντίληψη με τα LLM, έτσι ώστε τα μοντέλα να μπορούν να βλέπουν και να μιλάνε», υποστηρίζεται στην μελέτη.

Στα παραδείγματα χρήσης του Kosmos-1 περιλαμβάνει μια εικόνα που δείχνει ένα γατάκι και ένα άτομο που κρατά ένα χαρτί με ένα ζωγραφισμένο χαμόγελο στο στόμα του. Η προτροπή που δίνεται στην τεχνητή νοημοσύνη είναι «εξηγήστε γιατί αυτή η φωτογραφία είναι αστεία». Η απάντηση του Kosmos-1 είναι: «Η γάτα φοράει μια μάσκα που χαρίζει στη γάτα ένα χαμόγελο».

Κάθε ένα από τα παραδείγματα που εμφανίζονται στην μελέτη δείχνει τη δυνατότητα τεχνητής νοημοσύνης όπως το Kosmos-1 να αυτοματοποιούν μια εργασία σε πολλές καταστάσεις, από το να λένε σε έναν χρήστη των Windows 10 πώς να επανεκκινήσει τον υπολογιστή του (ή οποιαδήποτε άλλη εργασία με οπτική προτροπή), έως την ανάγνωση μιας ιστοσελίδας σχετικά με την έναρξη μιας αναζήτησης στο διαδίκτυο, την ερμηνεία δεδομένων υγείας από μια συσκευή, τη δημιουργία λεζάντας σε μια εικόνα και ούτω καθεξής.

Προς το παρόν το συγκεκριμένο μοντέλο τεχνητής νοημοσύνης δεν περιλαμβάνει δυνατότητες ανάλυσης βίντεο.

Οι ερευνητές της Microsoft εξέτασαν επίσης πώς το Kosmos-1 αποδίδει σε τεστ νοημοσύνης. Τα αποτελέσματα έδειξαν ένα «μεγάλο χάσμα απόδοσης μεταξύ του τρέχοντος μοντέλου και του μέσου επιπέδου ενός ενήλικου ανθρώπου», αλλά διαπίστωσαν επίσης ότι η ακρίβειά του δείχνει τη δυνατότητα για τα MLLM να «αντιλαμβάνονται αφηρημένα εννοιολογικά μοτίβα σε ένα μη λεκτικό πλαίσιο».

Η έρευνα για την «απάντηση σε ερωτήσεις ιστοσελίδων» είναι ενδιαφέρουσα δεδομένου του σχεδίου της Microsoft να χρησιμοποιήσει μοντέλα τεχνητής νοημοσύνης τέτοιου τύπου για να κάνει το Bing ικανότερη μηχανή αναζήτησης από την αντίστοιχη της Google.

Σύμφωνα με την μελέτη ο συγκεκριμένος τομέας απαιτεί από το μοντέλο να κατανοήσει τόσο τη σημασιολογία όσο και τη δομή των κειμένων. Εδώ, η δομή της ιστοσελίδας παίζει καθοριστικό ρόλο. «Η εργασία μπορεί να μας βοηθήσει να αξιολογήσουμε την ικανότητα του μοντέλου μας να κατανοεί τη σημασιολογία και τη δομή των ιστοσελίδων», εξηγούν οι ερευνητές της Microsoft.

Προσθήκη του ΟΤ.gr στην Google

Σχόλια

OT Originals

Experts 24.07.2026, 07:00

Καταργούνται οι περικοπές στις συντάξεις χηρείας

Τι προβλέπει η τροπολογία για τις συντάξεις χηρείας που ψηφίστηκε στη Βουλή

Παλαιολόγος Ι. Λιάζος

Economy 23.07.2026, 11:30

Γιατί η Ελλάδα μένει πίσω στην κούρσα της καινοτομίας

Καμπανάκι από το ΙΟΒΕ: Η Ελλάδα επενδύει πολύ λιγότερο στην έρευνα και την ανάπτυξη σε σύγκριση με την Ευρώπη

Γιάννης Αγουρίδης

World 23.07.2026, 18:49

Η ρωσική... Amazon βρίσκεται πλέον στο στόχαστρο της Ουκρανίας

Η Ουκρανία έχει εντείνει τις επιθέσεις της εναντίον του ρωσικού γίγαντα λιανικής πώλησης Wildberries, σηματοδοτώντας μια νέα φάση στον πόλεμο

Δημήτρης Σταμούλης

Aiolou 81: Εγκρίθηκε η μετατροπή πολυώροφου κτιρίου σε ξενοδοχείο

Τουρισμός 24.07.2026, 07:00

«Πράσινο» φως για ξενοδοχείο στην Αιόλου

Η έγκριση του υπουργείου Πολιτισμού για την επένδυση της Aiolou 81 ήταν αναγκαία λόγω της θέσης του κτιρίου, το οποίο βρίσκεται εντός του κηρυγμένου αρχαιολογικού χώρου της πόλης των Αθηνών

Λάμπρος Καραγεώργος

Λαγκάρντ: Ομόφωνη με αστερίσκους η απόφαση – Πόρτα για αύξηση επιτοκίων ελέω.. ενεργειακής κρίσης

World 23.07.2026, 16:38

Λαγκάρντ: «Παράθυρο» αύξησης των επιτοκίων ελέω... ενέργειας

Η Λαγκάρντ στην καθιερωμένη συνέντευξη Τύπου προειδοποίησε ότι οι κίνδυνοι για τον πληθωρισμό παραμένουν ανοδικοί

Τζούλη Καλημέρη

Google: Πρόστιμο 1 δισ. δολ. βάσει των κανόνων αντιμονοπωλιακής νομοθεσίας της ΕΕ για την τεχνολογία

World 23.07.2026, 13:56

Βαρύς πέλεκυς στην Google - Πρόστιμο 1 δισ. από ΕΕ

Το πρόστιμο είναι η πρώτη ποινή που επιβάλλεται στην Google βάσει του Νόμου περί Ψηφιακών Αγορών της ΕΕ

Ευθύμιος Τσιλιόπουλος

Business 23.07.2026, 11:42

Euroxx: «Βλέπει» ελκυστικό σημείο εισόδου στην μετοχή της Cenergy

Σύσταση «αγοράς» με τιμή στόχο τα 26,5 ευρώ για την Cenergy - Οι αναλυτές της Euroxx αναθεώρησαν το μοντέλο αποτίμησής τους

Τάσος Μαντικίδης

Καύσιμα: Στο τραπέζι η επαναφορά της κρατικής επιδότησης στο ντίζελ

Πετρέλαιο 23.07.2026, 07:00

«Πυροσβεστικά» μέτρα ξανά για τις αυξήσεις στα καύσιμα

Στην πεπατημένη των πυροσβεστικών μέτρων για τις αυξήσεις στα καύσιμα η κυβέρνηση - Τέλη Ιουλίου οι αποφάσεις - Συναγερμός στα 100 δολ. το βαρέλι

Χρήστος Κολώνας

Περισσότερα από Tεχνητή νοημοσύνη

Atoms: Το νέο μεγάλο στοίχημα του Τράβις Καλάνικ με χρηματοδότηση 1,7 δισ. δολαρίων

Tεχνητή νοημοσύνη 24.07.2026, 07:00

Από την Uber στην Atoms: Το νέο στοίχημα 1,7 δισ. του Καλάνικ

Η Atoms, νέα εταιρεία του συνιδρυτή της Uber, με τη στήριξη της Andreessen Horowitz, στοχεύει στην αυτοματοποίηση βιομηχανικών διαδικασιών μέσω ρομποτικής

Γιώργος Πολύζος

Google: «Καίει» δισεκατομμύρια για την Τεχνητή Νοημοσύνη

Τεχνολογία 23.07.2026, 08:17

Google: «Καίει» δισεκατομμύρια για την AI

Οι επενδύσεις σε data centers και υποδομές τεχνητής νοημοσύνης εκτόξευσαν τις κεφαλαιουχικές δαπάνες της Google έως και στα 205 δισ. δολάρια

Τεχνητή νοημοσύνη: Επιστροφή στα… συνδικάτα φέρνει η εισαγωγή της ΑΙ στις επιχειρήσεις

World 22.07.2026, 22:50

Η ΑΙ δίνει ώθηση στα... συνδικάτα στον κλάδο τεχνολογίας

Οι εργαζόμενοι στον τομέα της τεχνολογίας εντάσσονται όλο και περισσότερο σε συνδικάτα, ενισχύοντας την εργατική πλευρά στις συλλογικές διαπραγματεύσεις

Δημήτρης Σταμούλης

AMD και Anthropic σε μία από τις μεγαλύτερες κυκλικές συμφωνίες του κλάδου

Tεχνητή νοημοσύνη 22.07.2026, 20:30

Συμφωνία-μαμούθ AMD με την Anthropic για servers AI

Η AMD επενδύει έως 5 δισ. δολάρια στην εταιρεία του Claude, ενισχύοντας τη θέση της στην κούρσα της τεχνητής νοημοσύνης - Η Anthropic θα αγοράσει chips αξίας δεκάδων δισ. δολαρίων

OpenAI: Πρόβλημα με μοντέλα ΑΙ στη διάρκεια δοκιμών – «Άνευ προηγουμένου» παραβίαση ασφάλειας στη startup

Tεχνητή νοημοσύνη 22.07.2026, 16:22

Σοκ στην OpenAI - Παραβίαση ασφάλειας μετά από πρόβλημα με μοντέλα ΑΙ

Η OpenAI ανακοίνωσε ότι ένας αυτόνομος πράκτορας ξέφυγε από τον περιορισμό, απέκτησε πρόσβαση στο διαδίκτυο και παραβίασε το Hugging Face

Τεχνητή Νοημοσύνη: Η Ευρώπη επιταχύνει την κούρσα στην AI

Tεχνητή νοημοσύνη 22.07.2026, 13:03

Η Ευρώπη επιταχύνει στην κούρσα της τεχνητής νοημοσύνης

Ένα αυξανόμενο χάσμα μεταξύ μεγάλων και μικρότερων επιχειρήσεων ενδέχεται να ανακόψει την πρόοδο της Τεχνητής Νοημοσύνης στην Ευρώπη, σύμφωνα με την πρώτη έκδοση του Accenture AI Progress Barometer

Κίνα: Προς αυστηροποίηση των εξαγωγών μοντέλων ΑΙ και τσιπ το Πεκίκο

Tεχνητή νοημοσύνη 21.07.2026, 08:07

Αυστηροποιεί το Πεκίνο τις εξαγωγές μοντέλων ΑΙ και τσιπ

Οι αρχές στην Κίνα επιδιώκουν να αποτρέψουν την εξαγορά προηγμένων τεχνολογιών και ηγετικών start-up της χώρα από τη Δύση

Χρυσός: Συνεχίζει πτωτικά υπό το φόβο του πληθωρισμού

Η άνοδος της τιμής του πετρελαίου ενισχύει τις ανησυχίες για τον πληθωρισμό και την αύξηση των επιτοκίων

Markets 24.07.2026, 07:16

Σιτάρι: Παρατείνει το ράλι του Ιουλίου

Αβεβαιότητα γύρω από τη βραχυπρόθεσμη διαθεσιμότητα των εξαγωγών σιταριού

Καύσιμα: Τρέχουν οι αυξήσεις στην αντλία ενώ η κυβέρνηση πατάει φρένο στις επιδοτήσεις

Economy 24.07.2026, 07:00

Καύσιμα: Αυξήσεις στην αντλία, φρένο στις επιδοτήσεις

Η επιλογή να προηγηθεί από τα καύσιμα το πετρέλαιο κίνησης συνδέεται με την επίδρασή του σε κόστος μεταφοράς, παραγωγή και τελικές τιμές των αγαθών

Αλέξανδρος Κλώσσας

Inside Stories 24.07.2026, 07:00

Το… μπέρδεμα με τον STOXX, το τελευταίο «μαξιλάρι», το μήνυμα Περιστέρη, η επιστροφή του… Μπετόβεν και το deal Μetlen στην Κύπρο

Το rollercoaster στο ΧΑ

Τουρισμός 24.07.2026, 07:00

«Πράσινο» φως για ξενοδοχείο στην Αιόλου

Λάμπρος Καραγεώργος

Experts 24.07.2026, 07:00

Νέα ανάφλεξη

Η διαταραχή στα Στενά ωθεί το πετρέλαιο ψηλότερα και μαζί την ενέργεια, τα λιπάσματα, τα τρόφιμα, η τιμή του ευρωπαϊκού φυσικού αερίου προβλέπεται περίπου 30% υψηλότερη φέτος

Παναγιώτης Ε. Πετράκης

Κατασκευές 24.07.2026, 07:00

Η περιπέτεια του «Ε65» – Από «τυφλό» έργο σε δρόμο ανάπτυξης

Δεκαεννέα χρόνια για την κατασκευή των 182,1 χλμ. του αυτοκινητοδρόμου Ε65 - Τα εμπόδια και η εποχή των μνημονίων - Το reset του έργου

Χρήστος Κολώνας

Tεχνητή νοημοσύνη 24.07.2026, 07:00

Από την Uber στην Atoms: Το νέο στοίχημα 1,7 δισ. του Καλάνικ

Γιώργος Πολύζος

Ελεύθεροι επαγγελματίες: 8 στους 10 με συντάξεις πείνας, μόλις το 7% θα λάβει πάνω από 1.000 ευρώ

Εργασιακά – Ασφαλιστικά 24.07.2026, 07:00

Συντάξεις «πείνας» 800 ευρώ για 8 στους 10 επαγγελματίες

Η επιλογή των χαμηλών ασφαλιστικών κατηγοριών και για το 2026, επηρεάζει αρνητικά το τελικό ποσό της σύνταξης

Κώστας Παπαδής

Διακοπές: Που ξόδεψαν 3,68 δισ. οι Έλληνες – Η μέση ημερήσια δαπάνη [γραφήματα]

Economy 24.07.2026, 07:00

Πόσα ξοδεύουν οι Έλληνες τουρίστες – Πώς αντιδρούν στην ακρίβεια [γραφήματα]

Αποκαλυπτικά στοιχεία της ΕΛΣΤΑΤ για τη μέση ημερήσια δαπάνη ανά διάρκεια ταξιδιού και την κατανομή του προϋπολογισμού των νοικοκυριών στις διακοπές

Γιώργος Μανέττας

Sani Resort: Τι ταμείο έκανε το 2025 – Πού εστιάζουν οι φετινές επενδύσεις

Τουρισμός 24.07.2026, 07:00

Νέες επενδύσεις σε ξενοδοχεία σχεδιάζει η Sani Resorts

Η Sani Resort συνεχίζει το επενδυτικό πρόγραμμα για τη αναβάθμιση των υπηρεσιών και της εμπειρίας που προσφέρει στους επισκέπτες

Λάμπρος Καραγεώργος

Experts 24.07.2026, 07:00

Καταργούνται οι περικοπές στις συντάξεις χηρείας

Τι προβλέπει η τροπολογία για τις συντάξεις χηρείας που ψηφίστηκε στη Βουλή

Παλαιολόγος Ι. Λιάζος

ΕΚΤ: τέλος ενός κύκλου, ή αρχή ενός νέου;

Experts 24.07.2026, 07:00

Τέλος ή αρχή για τα επιτόκια;

Η απόφαση της Ευρωπαϊκής Κεντρικής Τράπεζας να διατηρήσει αμετάβλητα τα επιτόκια ήταν πλήρως αναμενόμενη. Η πραγματική είδηση, όμως, δεν ήταν η παύση.

Συμεών Μαυρουδής

Costa Bianca: Σύνθετο τουριστικό έργο 30.000 τ.μ. στην Ερμιονίδα

Τουρισμός 24.07.2026, 07:00

Costa Bianca: Ένα νέο τουριστικό χωριό σχεδιάζεται στην Ερμιονίδα

Σε δημόσια διαβούλευση το Ειδικό Πολεοδομικό Σχέδιο για σύνθετο τουριστικό κατάλυμα στην Ακτή Costa Bianca - Το στοίχημα για 12μηνη λειτουργίας

Λάμπρος Καραγεώργος

Ορμούζ: Μπορούν οι ΗΠΑ να ανοίξουν ξανά τα Στενά δια της βίας;

Ναυτιλία 24.07.2026, 07:00

Μπορούν οι ΗΠΑ να ανοίξουν τα Στενά του Ορμούζ δια της βίας;

Η ανανεωμένη αεροπορική εκστρατεία δεν έχει ακόμη καθησυχάσει τους πλοιοκτήτες ότι τα Στενά του Ορμούζ μπορούν να καταστούν ξανά ασφαλή από ιρανικές επιθέσεις

Ευθύμιος Τσιλιόπουλος

Commodities 24.07.2026, 06:44

Χρυσός: Η Κίνα αυξάνει τις εισαγωγές

Ανθεκτική η ζήτηση για χρυσό στην Κίνα

«Πράσινο φώς» της ΕΕ για την αναθεώρηση του Σχεδίου Ανάκαμψης

Πάτησε το κουμπί της παύσης η ΕΚΤ

Γερμανικά ομόλογα: Σε υψηλό 15ετίας εκτοξεύτηκε η απόδοση του 10ετούς

Νέα «φωτιά» στη φοιτητική στέγη [πίνακες]

Χρυσός: Συνεχίζει πτωτικά υπό το φόβο του πληθωρισμού

Σιτάρι: Παρατείνει το ράλι του Ιουλίου

Καύσιμα: Αυξήσεις στην αντλία, φρένο στις επιδοτήσεις

Το… μπέρδεμα με τον STOXX, το τελευταίο «μαξιλάρι», το μήνυμα Περιστέρη, η επιστροφή του… Μπετόβεν και το deal Μetlen στην Κύπρο

«Πράσινο» φως για ξενοδοχείο στην Αιόλου

Νέα ανάφλεξη

Το… μπέρδεμα με τον STOXX, το τελευταίο «μαξιλάρι», το μήνυμα Περιστέρη, η επιστροφή του… Μπετόβεν και το deal Μetlen στην Κύπρο

Καταργούνται οι περικοπές στις συντάξεις χηρείας

Γιατί η Ελλάδα μένει πίσω στην κούρσα της καινοτομίας

Η ρωσική... Amazon βρίσκεται πλέον στο στόχαστρο της Ουκρανίας

«Πράσινο» φως για ξενοδοχείο στην Αιόλου

Λαγκάρντ: «Παράθυρο» αύξησης των επιτοκίων ελέω... ενέργειας

Βαρύς πέλεκυς στην Google - Πρόστιμο 1 δισ. από ΕΕ

Euroxx: «Βλέπει» ελκυστικό σημείο εισόδου στην μετοχή της Cenergy

«Πυροσβεστικά» μέτρα ξανά για τις αυξήσεις στα καύσιμα

Από την Uber στην Atoms: Το νέο στοίχημα 1,7 δισ. του Καλάνικ

Google: «Καίει» δισεκατομμύρια για την AI

Η ΑΙ δίνει ώθηση στα... συνδικάτα στον κλάδο τεχνολογίας

Συμφωνία-μαμούθ AMD με την Anthropic για servers AI

Σοκ στην OpenAI - Παραβίαση ασφάλειας μετά από πρόβλημα με μοντέλα ΑΙ

Η Ευρώπη επιταχύνει στην κούρσα της τεχνητής νοημοσύνης

Αυστηροποιεί το Πεκίνο τις εξαγωγές μοντέλων ΑΙ και τσιπ

Χρυσός: Συνεχίζει πτωτικά υπό το φόβο του πληθωρισμού

Σιτάρι: Παρατείνει το ράλι του Ιουλίου

Καύσιμα: Αυξήσεις στην αντλία, φρένο στις επιδοτήσεις

Το… μπέρδεμα με τον STOXX, το τελευταίο «μαξιλάρι», το μήνυμα Περιστέρη, η επιστροφή του… Μπετόβεν και το deal Μetlen στην Κύπρο

«Πράσινο» φως για ξενοδοχείο στην Αιόλου

Νέα ανάφλεξη

Η περιπέτεια του «Ε65» – Από «τυφλό» έργο σε δρόμο ανάπτυξης

Από την Uber στην Atoms: Το νέο στοίχημα 1,7 δισ. του Καλάνικ

Συντάξεις «πείνας» 800 ευρώ για 8 στους 10 επαγγελματίες

Πόσα ξοδεύουν οι Έλληνες τουρίστες – Πώς αντιδρούν στην ακρίβεια [γραφήματα]

Νέες επενδύσεις σε ξενοδοχεία σχεδιάζει η Sani Resorts

Καταργούνται οι περικοπές στις συντάξεις χηρείας

Τέλος ή αρχή για τα επιτόκια;

Costa Bianca: Ένα νέο τουριστικό χωριό σχεδιάζεται στην Ερμιονίδα

Μπορούν οι ΗΠΑ να ανοίξουν τα Στενά του Ορμούζ δια της βίας;

Χρυσός: Η Κίνα αυξάνει τις εισαγωγές

ot.gr | Ταυτότητα