Κορυφαίοι όμιλοι τεχνητής νοημοσύνης αντικαθιστούν τους «data labellers» χαμηλού κόστους στην Αφρική και την Ασία με υψηλά αμειβόμενους ειδικούς του κλάδου, στην τελευταία προσπάθεια για τη δημιουργία «εξυπνότερων» και ισχυρότερων μοντέλων.
Εταιρείες όπως η Scale AI, η Turing και η Toloka προσλαμβάνουν κορυφαίους εμπειρογνώμονες σε τομείς όπως η βιολογία και τα χρηματοοικονομικά για να βοηθήσουν τους ομίλους τεχνητής νοημοσύνης να δημιουργήσουν πιο εξελιγμένα δεδομένα εκπαίδευσης, τα οποία είναι ζωτικής σημασίας για την ανάπτυξη της επόμενης γενιάς συστημάτων τεχνητής νοημοσύνης.
Η άνοδος των μοντέλων
Η άνοδος των λεγόμενων «συλλογιστικών» μοντέλων, όπως το o3 της OpenAI και το Gemini 2.5 της Google, έχει επιταχύνει την απομάκρυνση από την απασχόληση χιλιάδων εργαζομένων χαμηλού κόστους σε χώρες όπως η Κένυα και οι Φιλιππίνες, οι οποίοι συνήθως αμείβονται με λιγότερα από 2 δολάρια την ώρα για να αναλάβουν το χρονοβόρο έργο του σχολιασμού των τεράστιων συνόλων δεδομένων που χρησιμοποιούνται για την εκπαίδευση των μοντέλων AI.
«Ο κλάδος της τεχνητής νοημοσύνης επικεντρωνόταν για μεγάλο χρονικό διάστημα σε μεγάλο βαθμό στα μοντέλα και τους υπολογισμούς και τα δεδομένα ήταν πάντα ένα εποπτευόμενο μέρος της τεχνητής νοημοσύνης», δήλωσε η Όλγα Μεγκορσκάγια, διευθύνουσα σύμβουλος και συνιδρυτής του ολλανδικού ομίλου Toloka, προσθέτοντας: «Επιτέλους, [η βιομηχανία] αποδέχεται τη σημασία των δεδομένων για την εκπαίδευση».
Αλλαγή
Η αλλαγή αυτή έχει οδηγήσει σε ένα κύμα επενδυτικού ενδιαφέροντος για τις νεοφυείς επιχειρήσεις που ασχολούνται με την επισημείωση δεδομένων. Τον Ιούνιο, η Meta επένδυσε 15 δισ. δολάρια στον αμερικανικό όμιλο Scale AI, διπλασιάζοντας την αποτίμησή του σε 29 δισ. δολάρια, στο πλαίσιο μιας προσπάθειας να καλύψει την απόσταση από τους ανταγωνιστές της.
Τον Μάρτιο, η Turing AI με έδρα την Καλιφόρνια άντλησε 111 εκατ. δολάρια σε αποτίμηση 2,2 δισ. δολαρίων, ενώ η προσωπική εταιρεία Bezos Expeditions του Τζεφ Μπέζος ηγήθηκε τον Μάιο ενός επενδυτικού γύρου 72 εκατ. δολαρίων για την Toloka.
Προηγουμένως οι υπεύθυνοι επισήμανσης δεδομένων χειρίζονταν απλές εργασίες, όπως η σχεδίαση πλαισίων σε εικόνες για την αναγνώριση αντικειμένων, η περιγραφή των εικόνων που αντιπροσωπεύουν, η επιλογή εύγλωττων τρόπων έκφρασης και η απομάκρυνση των εσφαλμένων απαντήσεων από σύνολα δεδομένων που συχνά περιείχαν βίαιο ή γραφικό περιεχόμενο.
Λόγω του τα μοντέλα τεχνητής νοημοσύνης χρειάζονται περισσότερα δεδομένα για να αποδίδουν καλύτερα, οι εργαζόμενοι αυτοί αναμενόταν να επεξεργάζονται εργασίες σε δευτερόλεπτα και να ολοκληρώνουν εκατοντάδες εργασίες κατά τη διάρκεια μιας εργάσιμης ημέρας για τη δημιουργία τεράστιων συνόλων δεδομένων.
Τώρα, η ζήτηση για αυτές τις εργασίες έχει μειωθεί σημαντικά, καθώς πολλές από αυτές τις εργασίες μπορούν να αυτοματοποιηθούν, δήλωσε η Megorskaya.