Για πολλούς το διαδίκτυο ταυτίζεται με το Facebook και αριθμοί των χρηστών του αυξάνονται, σύμφωνα με τα τελευταία αποτελέσματα της Meta. Αλλά ο Μαρκ Ζάκερμπεργκ θέλει να εκμεταλλευτεί αυτές τις αυξητικές τάσεις χρησιμοποιώντας δεδομένα από Facebook και Instagram για να δημιουργήσει τεχνητή νοημοσύνη γενικού σκοπού. Αυτό μπορεί να ακούγεται ευχάριστο για μερικούς και η Meta είναι σε θέση να το εκμεταλλευτεί, αλλά οι χρήστες των μέσων κοινωνικής δικτύωσης μπορεί να το πληρώσουν με τα προσωπικά δεδομένα τους, και όχι μόνο.
«To επόμενο βήμα κλειδί για εμάς θα είναι η μάθηση από τα μοναδικά δεδομένα και την ανάδραση των προϊόντων μας… Σε Facebook και Instagram υπάρχουν εκατοντάδες δισεκατομμύρια εικόνες και δεκάδες δισεκατομμύρια βίντεο που μοιράζονται δημόσια, που θεωρούμε ότι είναι περισσότερα από τη βάση δεδομένων Common Crawl, και οι χρήστες επίσης μοιράζονται δημόσια μεγάλους αριθμούς κειμένων μέσω των υπηρεσιών μας».
Τεχνητή νοημοσύνη: Η Meta υπόσχεται να εντοπίζει τις «κατασκευασμένες» εικόνες στα σόσιαλ μίντια
Το θέμα που αναφέρει ο Ζάκερμπεργκ σχετικά με το Common Crawl προκάλεσε την έκπληξη αναλυτών του τομέα τεχνολογίας, καθώς το συγκεκριμένο είναι ήδη τεράστιο με 250 δισεκατομμύρια ιστοσελίδες επί 17 χρόνια, γράφει το Bloomberg.
Είναι ένα από τα μεγαλύτερα και πιο δημοφιλή αρχεία που χρησιμοποιούνται για να διδάσκονται συστήματα ΑΙ σήμερα. Όταν η OpenAI λανσάρισε το μοντέλο γλώσσας GPT-3, το 2020, περίπου 60% των κειμένων που χρησιμοποιήθηκαν για να εκπαιδεύσουν το μοντέλο προήλθε από το Common Crawl.
Περισσότερα δεδομένα, καλύτερη ΑΙ
Αλλά ο όγκος δεδομένων της Meta είναι ακόμη μεγαλύτερο, πράγμα που σημαίνει ότι μπορεί, θεωρητικά, να δημιουργήσει «εξυπνότερη» τεχνητή νοημοσύνη, και αυτό γιατί η έρευνα κατέδειξε ότι η εκπαίδευση μοντέλων ΑΙ με περισσότερα δεδομένα τείνει να τα κάνει ακριβέστερα και ικανότερα.
Αν ο Ζάκερμπεργκ θέλει να δημιουργήσει ένα ισχυρότερο chatbot, ο όγκος πληροφοριών που έχει είναι ιδιαίτερα πολύτιμος επειδή προέρχεται από σειρές σχολίων. Κείμενα που περιέχουν ανθρώπινους διαλόγους είναι κρίσιμα για την εκπαίδευση των αποκαλούμενων μοντέλων συζήτησης.
Η τελευταία «δονκιχωτική» φιλοδοξία του Ζάκερμπεργκ, δηλαδή η δημιουργία μιας «γενικής νοημοσύνης», συστήματα που φτάνουν ή ξεπερνούν την ανθρώπινη νοημοσύνη, είναι ιδιαίτερα μεγαλεπήβολη. Αλλά με τον όγκο δεδομένων του Ζάκερμπεργκ φαίνεται δυνατή. Το πρόβλημα είναι τι σημαίνει αυτό για εμάς, διερωτάται ο συντάκτης του Bloomberg.
Είναι περίεργο ότι όταν ο Ζάκερμπεργκ ανέφερε πως η ομάδα του χτίζει «γενική νοημοσύνη» εδώ και μια δεκαετία, προσέθεσε ότι μόνο τώρα θα στραφεί σε χρήση δεδομένων χρηστών. Αλλά γιατί δεν το έκανε μέχρι τώρα; Ίσως, γιατί, η χρήση θα ήταν μια ακόμη παραβίαση των προσωπικών δεδομένων δισεκατομμυρίων χρηστών. Αυτό θα ήγειρε, όχι μόνο ηθικές ενστάσεις, αλλά θα απαιτούσε αυστηρότατες παραμέτρους χρήσης των δεδομένων και συμμόρφωση με παγκόσμιους νόμους προστασίας δεδομένων και την επιτήρηση ευρωπαϊκών ρυθμιστικών αρχών.
Μεροληψία, τοξικότητα και προσωπικά δεδεομένα
Ένας άλλος λόγος είναι η μεροληψία και η τοξικότητα. H OpenAI αναγκάστηκε να το αντιμετωπίσει με το Common Crawl του οποίου η τεράστια βάση δεδομένων περιείχε ιστοσελίδες πορνογραφικού περιεχομένου, ενώ 4%-6% των ιστοτόπων περιείχε ρατσιστικά σχόλια, σχόλια μίσους και θεωρίες συνομωσίας.
Αν και οι ελεγκτικές υπηρεσίες έχουν γίνει καλύτερες στην αντιμετώπιση τέτοιων φαινομένων, δεν είναι τέλειες. Επιπλέον μπορεί να αναφέρεται και στην χρήση περιεχομένου από την εποχή πριν ο Ζάκερμπεργκ αρχίσει να προσέχει το περιεχόμενο.
Αν δεν είναι αρκετά προσεκτικός ρισκάρει επανάληψη του εφιάλτη δημόσιας κριτικής για τη χρήση δεδομένων του Facebook.
Αν κάτι χαρακτηρίζει τον Ζάκερμπεργκ είναι η βοναπαρτική εμμονή του για επικράτηση και νίκη. Μόλις 24 ώρες αφότου αντιμετώπισε μια ορδή οργισμένων γονέων που τον κατηγορούσαν ότι οδήγησε τα παιδιά τους στην αυτοκαταστροφή ή την αυτοκτονία, ανακοίνωνε τα άριστα τριμηνιαία αποτελέσματα της Meta και την χρήση δεδομένων χρηστών για την εκπαίδευση ΑΙ.
Αυτό θα πρέπει να μας υπενθυμίζει ότι ο δρόμος του Facebook προς τα πλούτη είναι σπαρμένος με τραγωδίες, οπότε μήπως το ίδιο μπορεί να συνεπάγεται και ο δρόμος προς την τεχνητή νοημοσύνη…;
Latest News
Το νέο μοντέλο ΑΙ από την OpenAΙ που «κοκκινίζει» στο... φλερτ
Οι εντυπωσιακές δυνατότητες του GPT-4o
Ποιοι κολοσσοί επενδύουν στη Γαλλία 15 δισ. ευρώ
Αφορούν τον τομέα της τεχνητής νοημοσύνης, της τεχνολογίας και των χρηματοοικονομικών
Ο Σαμ Άλτμαν «επιλέγει» τον δρόμο της πυρηνικής ενέργειας για την AI
Αντί για συμβατικούς αντιδραστήρες, η εταιρεία Oklo, στην οποία είναι πρόεδρος ο Άλτμαν, στοχεύει να χρησιμοποιήσει μίνι πυρηνικούς αντιδραστήρες
Επενδύσεις της Alibaba στην Κίνα για να κυριαρχήσει στην AI
Ο γίγαντας του ηλεκτρονικού εμπορίου προσφέρει πόρους με αντάλλαγμα συμμετοχή σε start up επιχειρήσεις
Έρχονται τσιπ AI και από την Arm Holdings
Η Arm που εδρεύει στο Ηνωμένο Βασίλειο θα δημιουργήσει ένα τμήμα μικροτσίπ τεχνητής νοημοσύνης και θα στοχεύσει να κατασκευάσει ένα πρωτότυπο μέχρι την άνοιξη του 2025
Η Microsoft αναπτύσσει Generative AI για... κατασκόπους
Η Microsoft ισχυρίζεται ότι το μοντέλο που δημιούργησε για την κυβέρνηση των ΗΠΑ είναι «καθαρό», που σημαίνει ότι μπορεί να διαβάζει αρχεία χωρίς να μαθαίνει από αυτά
Το ChatGPT μπαίνει στο iPhone - Κλείνει το deal
Η Apple «κάνει βουτιά» στην τεχνητή νοημοσύνη - Τα νέα χαρακτηριστικά του iOS 18
Το TikTok «ξεσκεπάζει» την τεχνητή νοημοσύνη - Πώς θα γίνεται η αυτόματη επισήμανση
Για την πραγματοποίηση αυτών των ενεργειών συνεργάζεται με τον Συνασπισμό για την Προέλευση και Αυθεντικότητα Περιεχομένου
Γιατί οι εργαζόμενοι κρύβουν ότι χρησιμοποιούν ΑΙ
Οι εργαζόμενοι χρησιμοποιούν κρυφά την τεχνητή νοημοσύνη καθώς φοβούνται ότι τους κάνει να φαίνονται αντικαταστάσιμοι, σύμφωνα με νέα έρευνα της Microsoft και του LinkedIn
Μέγας κίνδυνος για τον κόσμο τα Deepfakes - Τι επισημαίνει η Teneo
Τα deepfakes είναι πλέον το πιο επικίνδυνο είδος fake news