Τεχνητή Νοημοσύνη: Από τα γλωσσικά μοντέλα στη λήψη αποφάσεων

Τι δείχνει μελέτη της Goldman Sachs για την Τεχνητή Νοημοσύνη

Τεχνητή Νοημοσύνη: Από τα γλωσσικά μοντέλα στη λήψη αποφάσεων

Μετά από μια δεκαετία που καθορίστηκε από συστήματα τα οποία αναγνωρίζουν πρότυπα και προβλέπουν κείμενο, το όριο εξέλιξης της Τεχνητής Νοημοσύνης (ΤΝ) μετατοπίζεται προς μοντέλα που κατανοούν πώς λειτουργεί ο κόσμος. Η επόμενη φάση εξέλιξης της ΤΝ ενδέχεται να προκύψει λιγότερο από μεγαλύτερα μοντέλα και περισσότερο από συστήματα που μπορούν να προσομοιώνουν την πραγματικότητα, να δοκιμάζουν ενέργειες πριν τις υλοποιήσουν και να συλλογίζονται τις συνέπειες. Αυτή η νέα κατηγορία μοντέλων, γνωστή ως «μοντέλα κατανόησης του κόσμου», αποτελεί μια σιωπηλή αλλά καθοριστική αλλαγή στον τρόπο με τον οποίο οι μηχανές αποκτούν νοημοσύνη, σύμφωνα με έκθεση της Goldman Sachs.

Τα γλωσσικά μοντέλα

Τα τελευταία χρόνια, η τεχνητή νοημοσύνη έχει καθοριστεί από τα μεγάλα γλωσσικά μοντέλα (LLM). Εκπαιδευμένα σε τεράστιους όγκους κειμένου, έμαθαν να προβλέπουν την επόμενη λέξη με εντυπωσιακή ακρίβεια. Από αυτόν τον απλό στόχο προέκυψαν συστήματα που γράφουν, μεταφράζουν, προγραμματίζουν και συνομιλούν με αξιοσημείωτη ευχέρεια. Αυτό το επίτευγμα είναι πραγματικό και μετασχηματιστικό, όμως αναδεικνύει και έναν περιορισμό της σημερινής γενιάς μοντέλων ΤΝ.

Τα LLM είναι ιδιαίτερα ισχυρά στην ολοκλήρωση προτύπων, αλλά στερούνται της εσωτερικής αίσθησης του κόσμου που περιγράφουν αυτά τα πρότυπα. Ανταποκρίνονται αποτελεσματικά σε ερωτήματα, αλλά δυσκολεύονται να συλλογιστούν τις συνέπειες ή να λειτουργήσουν αξιόπιστα σε περιβάλλοντα όπου τα λάθη έχουν κόστος. Αυτός ο περιορισμός γίνεται ολοένα και πιο εμφανής καθώς τα συστήματα αυτά επεκτείνονται πέρα από το κείμενο. Όταν καλούνται να ελέγξουν ρομπότ, να διαχειριστούν ολόκληρες εφοδιαστικές αλυσίδες ή να συντονίσουν σύνθετες επιχειρησιακές ροές εργασίας, η πρόβλεψη από μόνη της αποδεικνύεται ανεπαρκής. Η νοημοσύνη, σε αυτά τα πλαίσια, απαιτεί περισσότερα από συσχετισμούς. Απαιτεί ένα εσωτερικό μοντέλο για το πώς λειτουργεί ο κόσμος.

Η πράξη

Αν δούμε τα επίπεδα στην πράξη: ένα LLM μπορεί να εξάγει όρους (covenants) από μια στοίβα συμβάσεων δανείων ή να συντάξει ένα σημείωμα προς την επενδυτική επιτροπή. Ένα μοντέλο φυσικού κόσμου μπορεί να προσομοιώσει πώς μια περίοδος τυφώνων μεταβάλλει την κατανομή ζημιών σε ένα χαρτοφυλάκιο αντασφάλισης. Ένα μοντέλο κοινωνικού κόσμου μπορεί να προβλέψει πώς ένα πολιτικό σοκ διαχέεται στις αγορές και στη συμπεριφορά. Οι πιο κρίσιμες αποφάσεις ενδέχεται τελικά να βασίζονται και στις τρεις αυτές δυνατότητες — ωστόσο, ήδη σήμερα αρκετές υψηλής αξίας χρηματοοικονομικές εργασίες παραμένουν ξεκάθαρα εντός του πεδίου των LLMs.

Αυτό που αλλάζει είναι ότι η ανάπτυξη αυτών των φυσικών εξελίξεων των LLM δεν αποτελεί πλέον μια περιθωριακή φιλοδοξία. Έχει εξελιχθεί σε στρατηγική προτεραιότητα για ορισμένους από τους πιο επιδραστικούς ερευνητές της Τεχνητής Νοημοσύνης.

Ο Yann LeCun, ο οποίος πρόσφατα αποχώρησε από τη θέση του Chief AI Scientist στη Meta, έχει τοποθετήσει τα world models στο επίκεντρο του οράματός του για την τεχνητή γενική νοημοσύνη, καθώς και της νέας του πρωτοβουλίας, της AMI Labs. Το πλαίσιο Joint-Embedding Predictive Architecture (JEPA) στοχεύει ρητά στη δημιουργία μηχανών που μαθαίνουν μοντέλα κατανόησης του κόσμου μέσω παρατήρησης, όπως οι άνθρωποι, εστιάζοντας στην πρόβλεψη αφηρημένων αναπαραστάσεων ή εννοιών για το τι ακολουθεί, χωρίς να αναπαράγουν κάθε λεπτομέρεια της πραγματικότητας.

Παράλληλα, η Fei-Fei Li, η καθηγήτρια του Stanford της οποίας το σύνολο δεδομένων ImageNet συνέβαλε καθοριστικά στην έκρηξη της deep learning εποχής, έχει ιδρύσει μια νέα πρωτοβουλία με επίκεντρο τη χωρική νοημοσύνη. Το έργο της στη World Labs υπογραμμίζει ότι η πραγματική νοημοσύνη δεν αφορά μόνο την αναγνώριση αντικειμένων σε εικόνες, αλλά και την κατανόηση του πώς αυτά τα αντικείμενα υπάρχουν στον χώρο, πώς αλληλεπιδρούν και πώς μεταβάλλονται με την πάροδο του χρόνου.

Οι προσομοιώσεις

Με άλλα λόγια, αντί να ζητάμε από τα μοντέλα να απαντούν απλώς σε ερωτήματα, οι ερευνητές δημιουργούν εσωτερικές αναπαραστάσεις του κόσμου ώστε να μπορούν να εκτελούν προσομοιώσεις μέσα σε αυτές. Αυτά τα λεγόμενα world models επιτρέπουν στα συστήματα να «φαντάζονται» αποτελέσματα πριν προβούν σε μια ενέργεια. Εκτελούν νοητικά πειράματα. Δοκιμάζουν πιθανότητες. Θα μπορούσε κανείς να το περιγράψει ως μια πρωτόλεια μορφή μηχανικής πρόβλεψης του μέλλοντος. Όμως ο όρος “world model” κρύβει μια σημαντική διάκριση.

Υπάρχουν δύο είδη κόσμων που η Τεχνητή Νοημοσύνη μαθαίνει να μοντελοποιεί. Ο ένας είναι ο φυσικός κόσμος της βαρύτητας, της τριβής, της θερμότητας και των δυνάμεων. Ο άλλος είναι ένας εικονικός ή κοινωνικός κόσμος, αποτελούμενος από πολλαπλούς αλληλεπιδρώντες «δρώντες» με στόχους, μνήμες και περιορισμούς. Ο καθένας από αυτούς δείχνει προς ένα διαφορετικό πεδίο εξέλιξης. Μαζί, υποδηλώνουν μια βαθύτερη μετατόπιση στο πώς ορίζεται η νοημοσύνη.

OT Originals
Περισσότερα από Tεχνητή νοημοσύνη

ot.gr | Ταυτότητα

Διαχειριστής - Διευθυντής: Λευτέρης Θ. Χαραλαμπόπουλος

Διευθυντής Σύνταξης: Χρήστος Κολώνας

Ιδιοκτησία - Δικαιούχος domain name: ΟΝΕ DIGITAL SERVICES MONOΠΡΟΣΩΠΗ ΑΕ

Μέτοχος: ALTER EGO MEDIA A.E.

Νόμιμος Εκπρόσωπος: Ιωάννης Βρέντζος

Έδρα - Γραφεία: Λεωφόρος Συγγρού αρ 340, Καλλιθέα, ΤΚ 17673

ΑΦΜ: 801010853, ΔΟΥ: ΚΕΦΟΔΕ ΑΤΤΙΚΗΣ

Ηλεκτρονική διεύθυνση Επικοινωνίας: ot@alteregomedia.org, Τηλ. Επικοινωνίας: 2107547007

Μέλος

ened
ΜΗΤ

Aριθμός Πιστοποίησης
Μ.Η.Τ.232433

Cookies