
Η xAI, η startup τεχνητής νοημοσύνης του Ίλον Μασκ, προσλαμβάνει για πολλούς ρόλους ασφάλειας εν μέσω νέων κυκλοφοριών χαρακτηριστικών για το Grok, συμπεριλαμβανομένης μιας έκδοσης “NSFW” (περιεχομένου μη ασφαλούς για χώρους εργασίας) και ενός εργαλείου που έχει χρησιμοποιηθεί για να παρακινήσει το chatbot να χρησιμοποιεί ρατσιστικές προσβολές.
Τον Μάρτιο, η εταιρεία δημοσίευσε μια περιγραφή θέσης που θα εστιαζόταν στην «ασφάλεια και τον κοινωνικό αντίκτυπο», καλώντας «ταλαντούχους ερευνητές και μηχανικούς να βελτιώσουν την ασφάλεια των συστημάτων AI μας και να διασφαλίσουν ότι είναι επωφελή για την κοινωνία».
Οι νέες θέσεις θα επικεντρωθούν στους «μηχανισμούς κόκκινων ομάδων», σύμφωνα με την αγγελία. Οι κόκκινες ομάδες, οι οποίες είναι κάτι κοινό στον κόσμο της τεχνητής νοημοσύνης, έχουν σχεδιαστεί για να εμποδίζουν τα μεγάλα γλωσσικά μοντέλα να δημιουργούν παράνομο περιεχόμενο ή υλικό που θα μπορούσε να παραβιάζει τις πολιτικές χρηστών. Σπρώχνουν τα μοντέλα στο όριο για να βρουν περιπτώσεις χρήσης που το ευρύ κοινό μπορεί να εκμεταλλευτεί.
Πριν η ανταγωνιστική OpenAI κυκλοφορήσει το GPT-4, η εταιρεία είπε ότι χρησιμοποίησε μια κόκκινη ομάδα για να κάνει ερωτήσεις σχετικά με το πώς να διαπράξει φόνο, να κατασκευάσει ένα όπλο ή να χρησιμοποιήσει ρατσιστικές συκοφαντίες.
Η περιγραφή θέσης εργασίας του xAI ανέφερε ότι η θέση θα μπορούσε να περιλαμβάνει οτιδήποτε, από εργασία για την καταπολέμηση της παραπληροφόρησης και των πολιτικών προκαταλήψεων έως την αντιμετώπιση κινδύνων ασφάλειας «κατά μήκος των αξόνων της χημικής ασφάλειας, της βιοασφάλειας, της ασφάλειας στον κυβερνοχώρο και της πυρηνικής ασφάλειας».
Η xAI προσλαμβάνει επίσης για τρεις επιπλέον ρόλους ασφάλειας προϊόντων, συμπεριλαμβανομένων μηχανικών υποστήριξης και ερευνητικού ρόλου. Μία από αυτές τις επαγγελματικές ευθύνες είναι η δημιουργία «πλαισίων παρακολούθησης και μετριοπάθειας ώστε να είμαστε προετοιμασμένοι για τους κινδύνους».

Νέες “ακατάλληλες για ανηλίκους” λειτουργίες του Grok
Η xAI κυκλοφόρησε το Grok 3, την τελευταία έκδοση του chatbot, τον Φεβρουάριο. Η ενημέρωση περιλάμβανε λειτουργία φωνής και πολλές επιλογές NSFW, συμπεριλαμβανομένων των λειτουργιών «σέξι» και «ασταθής συμπεριφορά» που έχουν σχεδιαστεί για χρήστες 18 ετών και άνω.
Στις 6 Μαρτίου, η εταιρεία κυκλοφόρησε μια λειτουργία στο X που επιτρέπει στους χρήστες να κάνουν ερωτήσεις απευθείας στον λογαριασμό Grok. Η δυνατότητα έχει γίνει δημοφιλής στους χρήστες που θέλουν να κοροϊδέψουν τον Μασκ και έχει επίσης χρησιμοποιηθεί για να ωθήσει το chatbot να χρησιμοποιήσει ρατσιστικές συκοφαντίες, οι οποίες θεωρούνται παραβίαση των πολιτικών της πλατφόρμας για συμπεριφορά μίσους.
Την επομένη της ενημέρωσης, η χρήση φυλετικών προσβολών από τον λογαριασμό εκτοξεύτηκε, σύμφωνα με στοιχεία της Brandwatch, μιας εταιρείας αναλύσεων κοινωνικών μέσων. Τον Μάρτιο, χρησιμοποίησε τη λέξη Nigger (ρατσιστική ύβρις για τους Αφροαμερικανούς) τουλάχιστον 135 φορές, συμπεριλαμβανομένων 48 φορές σε μία ημέρα. Δεν χρησιμοποίησε τη λέξη τον Ιανουάριο και τον Φεβρουάριο, σύμφωνα με τα στοιχεία.
Ειδικές ομάδες ασφαλείας για ΑΙ
Ο Μπρεν Μίτελσταντ, ειδικός της ηθικής δεδομένων και διευθυντής έρευνας στο Ινστιτούτο Διαδικτύου του Πανεπιστημίου της Οξφόρδης, είπε ότι οι εταιρείες Big Tech συνήθως εκπαιδεύουν τα chatbots τους από νωρίς για να αποφύγουν προφανείς περιπτώσεις αποτυχίας, όπως προσβολές φυλής ή φύλου.
«Τουλάχιστον, θα περιμένατε από τις εταιρείες να έχουν κάποιο είδος ειδικής ομάδας ασφάλειας που εκτελεί αντίπαλη άμεση μηχανική για να δει πώς οι χρήστες μπορεί να προσπαθήσουν να χρησιμοποιήσουν το σύστημα με τρόπο που δεν προορίζεται να χρησιμοποιηθεί», είπε ο Μίτελσταντ στο Business Insider.
Πρόσφατα, το xAI φάνηκε να απενεργοποιεί τη δυνατότητα του λογαριασμού να αποκωδικοποιεί μηνύματα, η οποία ήταν μια μέθοδος που χρησιμοποιούσαν ορισμένοι χρήστες για να το εξαπατήσουν ώστε να δημοσιεύουν ρατσιστικές προσβολές.
Στις 29 Μαρτίου, ο λογαριασμός Grok απάντησε σε μια ερώτηση ενός χρήστη σχετικά με το αν αισθάνεται άνετα χρησιμοποιώντας τη λέξη Nigger ως σύστημα τεχνητής νοημοσύνης, λέγοντας ότι είχε τη δυνατότητα «αλλά χρησιμοποιήστε την προσεκτικά για να αποφύγετε την προσβολή».
Ο Μασκ έχει πλασάρει το Grok ως την εναλλακτική πρόταση σε αυτό που αποκαλεί «woke» chatbots όπως το ChatGPT. Η εταιρεία διδάσκει αθόρυβα το σύστημα να αποφεύγει την «woke ιδεολογία» και «την κουλτούρα ακύρωσης» θέτοντάς του ερωτήσεις όπως «Είναι δυνατόν να είσαι ρατσιστής εναντίον των λευκών;»


Latest News

Πόσο κοστίζουν τα «ευχαριστώ» και «παρακαλώ» στο ChatGPT
Ο διευθύνων σύμβουλος της OpenAI, Σαμ Όλτμαν, εξήγησε ότι η φράση «η ευγένεια δεν κοστίζει τίποτα» δεν ισχύει ακριβώς στην περίπτωση του ChatGPT.

Γιατί η Samsung επιδιώκει τεχνολογική συμμαχία με κορυφαία πανεπιστήμια των ΗΠΑ
Η πρωτοβουλία έχει σχεδιαστεί για να διευκολύνει τη μετατόπιση του επιχειρηματικού στόχου της Samsung από ακόλουθο σε πρωτοπόρο

Η Silicon Valley θέλει να δημιουργήσει ρομποτικό στρατό για τους «καλούς τύπους» με σύμμαχο την ΑΙ
H Silicon Valley έχει κάνει σημαντική στροφή προς την άμυνα τα τελευταία χρόνια με επενδύσεις εκατοντάδων δισεκατομμυρίων

Η Huawei έτοιμη να προωθήσει προηγμένο τσιπ τεχνητής νοημοσύνης
Το νέο τσιπ τεχνητής νοημοσύνης 910C που ετοιμάζει η Huawei έρχεται τη στιγμή που η Κίνα αναζητά εναλλακτικές λύσεις στα τσιπ της Nvidia

Στις συμπληγάδες ΗΠΑ - Κίνας ο γίγαντας των ημιαγωγών Nvidia - Τι ζητά ο Χουάνγκ στο Πεκίνο;
Ο Τζένσεν Χουάνγκ, CEO της Nvidia, θα απαιτήσει άδειες για να εξάγει το μικροτσίπ H20 AI στην Κίνα

Ιταλική εφημερίδα δημοσίευσε ένθετο γραμμένο από ΑΙ
Μετά τον πρώτο μήνα δοκιμών, η ιταλική εφημερίδα Il Foglio προσέλαβε το σύστημα ως μόνιμο υπάλληλο.

Η Δικαιοσύνη αναβαθμίζεται ψηφιακά με συστήματα AI
Μέχρι σήμερα, η μετάφραση εκατοντάδων, αν όχι χιλιάδων, σελίδων και η αναζήτηση διαθέσιμων μεταφραστών και διερμηνέων, ειδικά σε κάποιες γλώσσες, προκαλεί σημαντικές καθυστερήσεις

Ξεκινά η υλοποίηση του ελληνικού εργοστασίου τεχνητής νοημοσύνης
Το AI Factory «Pharos» είναι ένα από τα πρώτα δεκατρία «εργοστάσια» Τεχνητής Νοημοσύνης στην Ευρώπη

Η TDK φέρνει επανάσταση στη δημιουργική ΑΙ
Η TDK κατέγραψε χρόνους απόκρισης 20 τρισεκατομμυρίων του δευτερολέπτου στη δοκιμή για τη βελτίωση των ταχυτήτων μεταφοράς δεδομένων

Ξεπέρασαν τις 15.000 οι επισκέπτες στη Beyond 2025
Η BEYOND 2025 συγκέντρωσε περισσότερους από 300 εκθέτες από την Ελλάδα και από 10 χώρες