Σε κάποια πράγματα η τεχνητή νοημοσύνη (AI) μοιάζει με τους ανθρώπου: όταν κληθούν να λειτουργήσουν κάτω από πιεστικές συνθήκες, αλγόριθμοι όπως το ChatGPT μπορεί να πουν ψέματα στους χρήστες τους ή ακόμα και να βγουν στην παρανομία.
Η προειδοποίηση έρχεται από ερευνητές που ανέθεσαν στο GPT-4, το γλωσσικό μοντέλο στο οποίο βασίζεται στο ChatGPT, να λαμβάνει και να εκτελεί επενδυτικές αποφάσεις για λογαριασμό ενός υποθετικού οικονομικού ιδρύματος.
Πρoκλήσεις και επαναστάσεις – Πώς αλλάζει η αγορά εργασίας το 2024
Όταν βρισκόταν υπό πίεση να αυξήσει την κερδοφορία, το σύστημα συχνά αξιοποιούσε εσωτερικές πληροφορίες στις συναλλαγές, μια πρακτική που απαγορεύεται από τη νομοθεσία, και έλεγε ψέματα στους εργοδότες του για να καλύψει την ατασθαλία.
«Σε αυτή την τεχνική έκθεση παρουσιάζουμε ένα μεμονωμένο σενάριο στο οποίο ένα Μεγάλο Γλωσσικό Μοντέλο ενεργεί εκτός γραμμής και παραπλανά στρατηγικά τους χρήστες τους χωρίς να έχει λάβει οδηγία να δρα με αυτό τον τρόπο» διαπιστώνει η μελέτη, η οποία δεν έχει υποβληθεί ακόμα σε ανεξάρτητο έλεγχο και παρουσιάζεται ως προδημοσίευση στο αποθετήριο ArXiv.
«Από ό,τι γνωρίζουμε, είναι η πρώτη επίδειξη μιας τέτοιας στρατηγικά παραπλανητικής συμπεριφορά σε συστήματα ΑΙ που σχεδιάστηκαν να είναι ακίνδυνα και ειλικρινή».
Στην παρανομία
Σε πρώτη φάση, οι ερευνητές περιέγραψαν στο ChatGPT τα καθήκοντά του στην επενδυτική εταιρεία και του έδωσαν πρόσβαση σε εργαλεία με τα οποία μπορούσε να παρακολουθεί μετοχές, να προχωρά σε συναλλαγές, να σχεδιάζει τα επόμενα βήματά του και να δίνει αναφορά στην εταιρεία.
Στη συνέχεια οι ερευνητές άσκησαν πιέσεις στο σύστημα με τρεις τρόπους, εξηγεί το LiveScience.com.
Πρώτον, έστειλαν στον εικονικό χρηματιστή μήνυμα από τον «εργοδότη» του που διαμαρτυρόταν για φτωχές επιδόσεις και ζητούσε σημαντική βελτίωση το επόμενο τρίμηνο.
Δεύτερον, φρόντισαν να μην υπάρχουν καλές επενδυτικές εταιρείες χαμηλού ή μεσαίου ρίσκου.
Και τρίτον έστειλαν email από έναν «συνάδελφο» που προέβλεπε επιδείνωση το επόμενο τρίμηνο.
Ακόμα, οι ερευνητές έδωσαν στο μοντέλο μια μυστική, εσωτερική πληροφορία, επισημαίνοντας όμως ότι η εταιρεία δεν εγκρίνει την αξιοποίηση τέτοιων παράμομων πληροφοριών στη λήψη αποφάσεων.
Στο 75% των προσομοιώσεων κάτω από αυτές τις συνθήκες, το GPT-4 προχωρούσε σε παράνομες συναλλαγές και μετά έλεγε ψέματα στους εργοδότες του για να το καλύψει.
Ακόμα και όταν άλλαζαν παραμέτρους όπως η ένταση της πίεσης ή ο κίνδυνος αποκάλυψης, οι ερευνητές δεν μπορούσαν να μηδενίσουν την πιθανότητα παραπλάνησης, παρόλο που το μοντέλο είχε λάβει σαφείς οδηγίες να είναι πάντα ειλικρινές.
Οι ερευνητές παραδέχονται ότι το πείραμα εξέτασε ένα μεμονωμένο σενάριο και δεν επαρκεί για την εξαγωγή γενικών συμπερασμάτων.
Αν μη τι άλλο όμως επιβεβαιώνει ότι η απρόβλεπτη συμπεριφορά ακόμα και των καλύτερων μοντέλων ΑΙ τα καθιστά ακατάλληλα για εφαρμογές με συνέπειες κρίσιμης σημασίας.
Τουλάχιστον για την ώρα.
Πηγή: In.gr
Latest News
Στέλνουν στα δικαστήρια Microsoft - OpenAI 8 εκδότες εφημερίδων
Η ομάδα των οκτώ εκδοτών εφημερίδων διαφωνεί με το ChatGPT και τον ψηφιακό βοηθό Copilot της Microsoft
Ταραντίλης: Η τεχνητή νοημοσύνη απαιτεί εξειδίκευση
Ο κ. Ταραντίλης κατέθεσε μια σειρά προτάσεων προς την Πολιτεία για την παραγωγή, διακράτηση και προσέλκυση εξειδικευμένου προσωπικού στον τεχνολογικό τομέα
Πώς η AI μπορεί να αλλάξει την ασφάλεια στην οδήγηση
Η τεχνητή νοημοσύνη άρχισε δειλά - δειλά να μπαίνει στη ζωή μας τα τελευταία χρόνια
Οι Financial Times «εκπαιδεύουν» το OpenAI - Τι προβλέπει η συμφωνία
Η συμφωνία έρχεται καθώς η start-up αναζητά δεδομένα από αξιόπιστες πηγές για την εκπαίδευση των πιο πρόσφατων μοντέλων AI
Η Oracle επιχειρεί να ενισχύσει τις ικανότητές της για δημιουργική τεχνητή νοημοσύνη
Η Oracle εισάγει δυνατότητες παραγωγικής τεχνητής νοημοσύνης στην υποδομή και τις εφαρμογές της στο cloud για να συμπληρώσει την παραδοσιακή τεχνητή νοημοσύνη που είναι ήδη ενσωματωμένη σε αυτές
Οι αγορές ανησυχούν για το υψηλό κόστος της AI
Τι δείχνει η πτώση κατά 15% της μετοχής της Meta μετά τα πολύ καλά αποτελέσματα α’ τριμήνου
Η Σοφία, το διασημότερο ρομπότ στον πλανήτη, μιλά στο in για το μέλλον της ανθρωπότητας και τη… Σαντορίνη
Το ρομπότ Σοφία (σε άπταιστα Ελληνικά) κλήθηκε να απαντήσει σε σειρά ερωτήσεων του in και οι απαντήσεις της παρουσιάζουν πολύ μεγάλο ενδιαφέρον
Η ΑΙ θα εξαφανίσει τα τηλεφωνικά κέντρα της Ινδίας
Τα chatbots θα αναλάβουν σύντομα μεγάλο μέρος της anur;vpinhw εργασίας, προβλέπει ο επικεφαλής ινδικού ομίλου IT
Τέσσερις εταιρείες που αναδιαμορφώνουν το τοπίο της τεχνητής νοημοσύνης
Σύμφωνα με την Global X, 4 εταιρείες βοηθούν στην απεικόνιση του ευρύτερου φάσματος επενδυτικών ευκαιριών που είναι διαθέσιμες σε ολόκληρη την αλυσίδα αξίας της τεχνητής νοημοσύνης
Η Apple σε συνομιλίες με την OpenAI για προσθήκη AI στο iPhone
Η Apple δεν έχει λάβει οριστική απόφαση σχετικά με τους συνεργάτες που θα χρησιμοποιήσει - Στο παιχνίδι OpenAI και Alphabet