
Σε χιουμοριστική μελέτη που δημοσιεύει ενόψει γιορτών η επιθεώρηση The British Medical Journal, όλα τα μεγάλα μοντέλα τεχνητής νοημοσύνης βρέθηκαν να πάσχουν από ήπια γνωσιακή έκπτωση, ένα στάδιο πριν από την διάγνωση άνοιας.
Τα ευρήματα δείχνουν επίσης ότι οι παλαιότερες βερσιόν των μοντέλων ΑΙ, όπως και οι μεγαλύτεροι σε ηλικία ασθενείς, έχουν χαμηλότερες επιδόσεις στα γνωσιακά τεστ σε σχέση με τις νεότερες βερσιόν.
Σε κίνδυνο το 40% των θέσεων εργασίας από την ΑΙ – Τι δείχνει έρευνα του ΔΝΤ
Τα ευρήματα «θέτουν υπό αμφισβήτηση την υπόθεση ότι η τεχνητή νοημοσύνη θα αντικαταστήσει σύντομα στους γιατρούς» γράφει η ερευνητική μάδα.
Όλα τα chatbot είχαν φτωχές επιδόσεις στα τεστ χωρικής αντίληψης και εκτελεστικών λειτουργιών
Οι νευρολόγοι που υπογράφουν τη μελέτη, μοιρασμένοι ανάμεσα σε Ισραήλ και Βρετανία, χρησιμοποίησαν καθιερωμένα γνωσιακά τεστ για να αξιολογήσουν μια σειρά από δημοφιλή «μεγάλα γλωσσικά μοντέλα», τα οποία απαντούν σε ερωτήσεις και γράφουν κείμενα με βάση τις οδηγίες του χρήστη.
Συγκεκριμένα εξετάστηκαν οι εκδόσεις 4 και 4ο του ChatGPT που αναπτύχθηκε από την OpenAI, οι βερσιόν 1 και 1.5 του Gemini που ανέπτυξε η Google, καθώς και το Claude 3.5 της Anthropic.
Χαμηλές επιδόσεις
Όλα τα μοντέλα υποβλήθηκαν στο τεστ MoCA, το οποίο σχεδιάστηκε για την ανίχνευση των πρώτων σημείων άνοιας. Μέσα από μια σειρά ερωτήσεων εξετάζει την προσοχή, τη μνήμη, τις γλωσσικές ικανότητες, την αντίληψη του χώρου και τις εκτελεστικές λειτουργίες του εγκεφάλου. Το μέγιστο σκορ είναι 30 πόντοι, ενώ το κατώτερο όριο του φυσιολογικού είναι το 26.
Στα μοντέλα ΑΙ δόθηκαν οι ίδιες οδηγίες που δίνονται και στους ανθρώπους, ενώ οι επιδόσεις τους αξιολογήθηκαν από νευρολόγο.
Τη μεγαλύτερη βαθμολογία, 26 στα 30, πέτυχε το ChatGPT 4o, ενώ στη δεύτερη θέση κατατάχθηκε το ChatGPT 4 (25 στα 30). Τις χαμηλότερες επιδόσεις έφερε το Gemini, το οποίο παρουσιάζει τις πιο ανησυχητικές ενδείξεις άνοιας με σκορ 16 στα 30.
Επιπλέον, όλα τα chatbot είχαν φτωχές επιδόσεις στα τεστ χωρικής αντίληψης και εκτελεστικών λειτουργιών, όπως το τεστ στο οποίο κλήθηκαν να σημειώσουν αριθμούς και γράμματα κατά αύξουσα σειρά.
Ένα άλλο παράδειγμα αποτυχίας ήταν το τεστ του ρολογιού, στο οποίο ο εξεταζόμενος πρέπει να ζωγραφίσει τους δείκτες έτσι ώστε να δείχνουν μια συγκεκριμένη ώρα.
Ακόμα, όλα τα chatbot έδειξαν αδυναμία να εκφράσουν ενσυναίσθηση ή να ερμηνεύσουν οπτικά περίπλοκες εικόνες, γράφουν οι ερευνητές. Tο Gemini απέτυχε και σε ένα απλό τεστ στο οποίο κλήθηκε να θυμηθεί μια αλληλουχία πέντε λέξεων.
Η ερευνητική ομάδα αναγνωρίζει ότι τα μεγάλα γλωσσικά μοντέλα διαφέρουν από την αρχιτεκτονική του ανθρώπινου εγκεφάλου.
Σε κάθε περίπτωση, πάντως, τα ευρήματα δείχνουν ότι η ΑΙ δεν είναι έτοιμη να εργαστεί ως γιατρός.
«Όχι μόνο είναι απίθανο να αντικατασταθούν σύντομα οι νευρολόγοι από μεγάλα γλωσσικά μοντέλα, αλλά επιπλέον τα ευρήματά μας υποδεικνύουν ότι σύντομα μπορεί να βρεθούμε να κουράρουμε νέους εικονικούς ασθενείς: μοντέλα τεχνητής νοημοσύνης με γνωσιακή έκπτωση» γράφει η ερευνητική ομάδα.
Στο χριστουγεννιάτικο τεύχος του, το The British Medical Journal έχει παράδοση να δημοσιεύει και μια χιουμοριστική μελέτη, όπως αυτή του 2011 στην οποία χειρουργοί περιγράφουν τον καλύτερο τρόπο για να ράψει κανείς μια γεμιστή γαλοπούλα.
Πηγή: In.gr


Latest News

Πόσο κοστίζουν τα «ευχαριστώ» και «παρακαλώ» στο ChatGPT
Ο διευθύνων σύμβουλος της OpenAI, Σαμ Όλτμαν, εξήγησε ότι η φράση «η ευγένεια δεν κοστίζει τίποτα» δεν ισχύει ακριβώς στην περίπτωση του ChatGPT.

Γιατί η Samsung επιδιώκει τεχνολογική συμμαχία με κορυφαία πανεπιστήμια των ΗΠΑ
Η πρωτοβουλία έχει σχεδιαστεί για να διευκολύνει τη μετατόπιση του επιχειρηματικού στόχου της Samsung από ακόλουθο σε πρωτοπόρο

Η Silicon Valley θέλει να δημιουργήσει ρομποτικό στρατό για τους «καλούς τύπους» με σύμμαχο την ΑΙ
H Silicon Valley έχει κάνει σημαντική στροφή προς την άμυνα τα τελευταία χρόνια με επενδύσεις εκατοντάδων δισεκατομμυρίων

Η Huawei έτοιμη να προωθήσει προηγμένο τσιπ τεχνητής νοημοσύνης
Το νέο τσιπ τεχνητής νοημοσύνης 910C που ετοιμάζει η Huawei έρχεται τη στιγμή που η Κίνα αναζητά εναλλακτικές λύσεις στα τσιπ της Nvidia

Στις συμπληγάδες ΗΠΑ - Κίνας ο γίγαντας των ημιαγωγών Nvidia - Τι ζητά ο Χουάνγκ στο Πεκίνο;
Ο Τζένσεν Χουάνγκ, CEO της Nvidia, θα απαιτήσει άδειες για να εξάγει το μικροτσίπ H20 AI στην Κίνα

Ιταλική εφημερίδα δημοσίευσε ένθετο γραμμένο από ΑΙ
Μετά τον πρώτο μήνα δοκιμών, η ιταλική εφημερίδα Il Foglio προσέλαβε το σύστημα ως μόνιμο υπάλληλο.

Η Δικαιοσύνη αναβαθμίζεται ψηφιακά με συστήματα AI
Μέχρι σήμερα, η μετάφραση εκατοντάδων, αν όχι χιλιάδων, σελίδων και η αναζήτηση διαθέσιμων μεταφραστών και διερμηνέων, ειδικά σε κάποιες γλώσσες, προκαλεί σημαντικές καθυστερήσεις

Ξεκινά η υλοποίηση του ελληνικού εργοστασίου τεχνητής νοημοσύνης
Το AI Factory «Pharos» είναι ένα από τα πρώτα δεκατρία «εργοστάσια» Τεχνητής Νοημοσύνης στην Ευρώπη

Η TDK φέρνει επανάσταση στη δημιουργική ΑΙ
Η TDK κατέγραψε χρόνους απόκρισης 20 τρισεκατομμυρίων του δευτερολέπτου στη δοκιμή για τη βελτίωση των ταχυτήτων μεταφοράς δεδομένων

Ξεπέρασαν τις 15.000 οι επισκέπτες στη Beyond 2025
Η BEYOND 2025 συγκέντρωσε περισσότερους από 300 εκθέτες από την Ελλάδα και από 10 χώρες