Ο Τζάρεντ Κουίνσι Ντέιβις και η startup εταιρεία υπολογιστών ειδικά για την τεχνητή νοημοσύνη Foundry πωλούν συμπεράσματα. Δεν φτιάχνουν μικροτσίπ ούτε φτιάχνουν μεγάλα μοντέλα γλώσσας. Το Foundry έχει μια μοναδική μέθοδο για να κάνει το cloud computing πιο αποτελεσματικό. Αντί να πουλήσει την τεχνολογία της σε παρόχους cloud, η ομάδα του Foundry αποφάσισε να γίνει η ίδια τέτοια εταιρεία και να χρησιμοποιήσει την τεχνολογία της για να λειτουργήσει ένα πιο αποτελεσματικό cloud.
Μόλις οι εταιρείες που θέλουν να αξιοποιήσουν και να πουλήσουν ένα προϊόν για τεχνητή νοημοσύνη που έχουν εκπαιδεύσει τα μοντέλα τους και γνωρίζουν ότι έχουν απόδοση, αναζητούν ευκολία, ταχύτητα και αξία κάθε φορά που παράγουν αποτελέσματα. Οι πάροχοι υπηρεσιών Inference-as-a-service, όπως η Foundry, στοχεύουν στην απλοποίηση της διαδικασίας δημιουργίας αυτών των αποτελεσμάτων.
Οι Big Tech επαναφέρουν στη ζωή την πυρηνική ενέργεια [γραφήματα]
Η Foundry προσφέρει επίσης εκπαίδευση και λεπτομέρεια, όπως κάνουν πολλοί πάροχοι cloud, αλλά αυτές τις μέρες, φαίνεται ότι οποιοσδήποτε με τεχνολογία ενίσχυσης υπολογιστών AI προσπαθεί να δημιουργήσει έσοδα πουλώντας συμπεράσματα — ή πιο συγκεκριμένα, token, τη βασική μονάδα δεδομένων στην τεχνητή νοημοσύνη, σημειώνει ο Business Insider.
H Cerebras πουλάει επίσης συμπεράσματα. Η βασική τεχνογνωσία της εταιρείας είναι ο σχεδιασμός τσιπ για εκπαίδευση και εξαγωγή συμπερασμάτων, αλλά πρόσφατα άρχισε να πουλά τα τελευταία ως υπηρεσία. Το ίδιο και η Groq, μια εταιρεία τσιπ που ιδρύθηκε από δύο πρώην υπαλλήλους της Google, οι οποίοι αναγνώρισαν νωρίς ότι το συμπέρασμα επρόκειτο να πάρει το μεγαλύτερο μερίδιο της αγοράς πληροφορικής. Η SambaNova Systems, μια άλλη πλατφόρμα υλικού, πουλά επίσης την εξαγωγή συμπερασμάτων ως υπηρεσία.
Εταιρείες όπως η Lambda, η CoreWeave, η Together AI και η Crusoe, όλες στενοί συνεργάτες της Nvidia, διαχειρίζονται κέντρα δεδομένων κατάλληλα για φόρτους εργασίας AI και προσφέρουν υπηρεσίες συμπερασμάτων. Και μετά υπάρχουν οι υπερκλιμακωτές όπως το AWS και το Microsoft Azure.
Με τόσες πολλές εταιρείες που ειδικεύονται στην εξαγωγή συμπερασμάτων στην τεχνητή νοημοσύνη, αυξάνονται οι υποψίες ότι το κόστος της εξαγωγής συμπερασμάτων πρόκειται να πέσει κατακόρυφα.
«Μία αιτία που το συμπέρασμα είναι λίγο εμπορευματοποιήσιμο είναι ότι οι πελάτες πληρώνουν κάπως για tokens στο τέλος της ημέρας, ανέφερε στο Business Insider ο Ντέιβις. Η τρέχουσα αγορά συμπερασμάτων μοιάζει με την την αγορά ηλεκτρικής ενέργειας, ξεκαθάρισε ο Ντέιβις. Υπάρχουν πολλές εξειδικευμένες πηγές στις οποίες μπορείτε να έχετε πρόσβαση αν κάνετε πραγματικά αγορές, αλλά δεν το κάνουν όλοι. Οι περισσότεροι θέλουν απλώς να γυρίσουν τον διακόπτη του ηλεκτρικού ρεύματος.
Υπάρχουν όμως πολλές αποχρώσεις για όσους θέλουν. Για ορισμένους πελάτες, η ταχύτητα είναι υψίστης σημασίας. Η ταχύτητα έχει επίσης διακρίσεις, όπως ο χρόνος για το πρώτο token και τα tokens ανά δευτερόλεπτο. Υπάρχει συνολικός χρόνος ολοκλήρωσης της εργασίας και υπάρχουν διάφορα είδη φόρτου εργασίας συμπερασμάτων που προσφέρονται για διαφορετικές ρυθμίσεις υπολογιστών.
Η ενεργειακή απόδοση του υποκείμενου υλικού και της δικτύωσης είναι ένας μεγάλος καθοριστικός παράγοντας του κόστους. Και το κόστος στον υπολογισμό συμπερασμάτων είναι ακόμη πιο σημαντικό από ό,τι στην εκπαίδευση, δήλωσε πρόσφατα στο Business Insider ο συνιδρυτής της Groq, Τζόναθαν Ρος. Η εκπαίδευση είναι ένα γενικό κόστος, ενώ το συμπέρασμα είναι ένα λειτουργικό κόστος.
Κάντε σμίκρυνση από όλες τις περιπλοκές και το συμπέρασμα γίνεται το εμπόρευμα της εποχής της τεχνητής νοημοσύνης. «Ορισμένες εταιρείες θέλουν απλώς παραγωγή και δεν τους νοιάζει η υποδομή», είπε στο Business Insider ο Μιτές Αγκραβάλ, επικεφαλής του cloud για τη Lambda.
Τεχνητή νοημοσύνη και εμπορευματοποίηση
Η Lambda βρίσκεται στα πρώτα στάδια μιας προσφοράς συμπερασμάτων ως υπηρεσίας στην τεχνητή νοημοσύνη, αλλά ο Αγκραβάλ είπε ότι η εταιρεία το κάνει προσεκτικά, εστιάζοντας στην παροχή ολιστικών υπολογιστικών υπηρεσιών, και όχι μόνο διακριτικών.
Τα περιθώρια κέρδους συμπερασμάτων μπορεί να ποικίλλουν ευρέως, είπε ο Αγκραβάλ. Με τη γενική υπολογιστική — όπου ο πελάτης νοικιάζει σταθερή χωρητικότητα — τα περιθώρια είναι ευκολότερο να διαχειριστούν. Όταν χρεώνετε τη χρήση ή την είσοδο και την έξοδο ενός μοντέλου, η απόδοση είναι λιγότερο προβλέψιμη.
Η οργάνωση πολλών χρηστών σε έναν πεπερασμένο αριθμό διακομιστών απαιτεί… φινέτσα. Το αν το κόστος λειτουργίας του υλικού καλύπτεται πράγματι με περιθώρια κέρδους εξαρτάται από το πόσο καλά γίνεται αυτή η οργάνωση, εξήγησε ο Αγκραβάλ.
Γιατί λοιπόν τα neocloud να προσφέρουν την πιο επικίνδυνη υπηρεσία;
Ο Agrawal είπε ότι πρόκειται για την είσοδο πιθανών πελατών. Οι πελάτες του συμπερασμάτων ως υπηρεσίας μπορούν να μετατραπούν σε πιο παραδοσιακούς πελάτες υπολογιστών και καθώς μεγαλώνει η λίστα των ανταγωνιστών, οι σχέσεις και η ιστορία αποκτούν σημασία.
Τα οικονομικά μοντέλα της Lambda υποθέτουν ότι οι περικοπές τιμών θα έρθουν σύντομα καθώς περισσότεροι παίκτες εισέρχονται στο χώρο των συμπερασμάτων και τα τσιπ γίνονται πιο αποτελεσματικά.
Κούρσα προς τα κάτω;
Το πόσο γρήγορα αυξάνεται η ζήτηση για συμπεράσματα είναι αντικείμενο συζήτησης, αλλά σε πρόσφατες δημόσιες δηλώσεις, ο Διευθύνων Σύμβουλος της Nvidia, Τζένσεν Χουάνγκ, έχει πει πολλές φορές ότι τα νέα μοντέλα, όπως το o1 της OpenAI, απαιτούν περισσότερους υπολογισμούς για να δημιουργήσουν τον ίδιο αριθμό απαντήσεων, επειδή εκτελούν πολλαπλά μοντέλα για να ελέγξουν τη δική τους δουλειά ή «λόγο». Η ακρίβεια, αποδεικνύεται, απαιτεί περισσότερους υπολογισμούς.
Τα φορτία συμπερασμάτων πρόκειται να αυξηθούν, αλλά οι πάροχοι υπηρεσιών εξακολουθούν να αναμένουν πτώση της τιμής από την εισροή νέων παικτών. Ωστόσο, ο Ντέιβις δεν ανησυχεί.
Υπενθύμισε το παράδοξο του Jevon – μια οικονομική αρχή στην οποία η πτώση της τιμής ή η αύξηση της απόδοσης οδηγεί σε μεγαλύτερη συνολική κατανάλωση – όπως όταν διαπλατύνετε έναν αυτοκινητόδρομο και η κυκλοφορία γίνεται χειρότερη.
«Αν κάνω κάτι 10 φορές φθηνότερο, οι άνθρωποι δεν θα ξοδέψουν 10 φορές λιγότερα, ούτε καν θα κρατήσουν τον προϋπολογισμό τους το ίδιο. Θα ξοδέψουν περισσότερα», είπε ο Ντέιβις. «Αυτό είναι λογικό γιατί αυτό που κάνετε όταν κάνετε κάτι 10 φορές φθηνότερο, βελτιώνετε την απόδοση της επένδυσης».
Με άλλα λόγια, «αποδεικνύεται ότι όταν κάνετε τα συμπεράσματα φθηνότερα, οι άνθρωποι αποφασίζουν να κάνουν πολύ περισσότερα συμπεράσματα», είπε ο Ντέιβις.
Η πορεία που θα ακολουθήσει θα μπορούσε να είναι «ανώμαλη» ωστόσο και δεν είναι πιθανό όλοι οι παίκτες να επιβιώσουν από τις στιγμές αναντιστοιχίας μεταξύ προσφοράς και ζήτησης.
«Όπως έλεγε το παλιό μου αφεντικό στην Intel, Άντι Γκρόουβ, “αφήστε το χάος να βασιλέψει και μετά να βασιλέψτε στο χάος», δήλωσε ο Σιράμ Βισβαναθάν, ιδρυτικός συνεργάτης της Celesta Capital και επενδυτής στη SambaNova Systems.
Συμφωνεί ότι τα επόμενα χρόνια θα είναι εξαιρετικά ανταγωνιστικά για τους παρόχους συμπερασμάτων, αλλά πιστεύει ότι οι νικητές θα κριθούν βάσει αξίας. «Η βασική καινοτομία δεν μπορεί να βρίσκεται στην αγορά, αλλά στην απόδοση και τη δύναμη της υποκείμενης αρχιτεκτονικής», είπε ο Βισβαναθάν.
Πολλές από τις εταιρείες που πωλούν tokens για να μπουν στην αγορά της τεχνητής νοημοσύνης φιλοδοξούν να αποκτήσουν περισσότερα. Οι σχεδιαστές τσιπ τελικά θέλουν να πουλήσουν τσιπ σε υπερκλιμακωτές αντί να συνάγουν συμπεράσματα σε νεοφυείς επιχειρήσεις τεχνητής νοημοσύνης. Η απόλυτη έκδοση της τεχνολογίας του Foundry είναι επίσης μεγαλύτερη.
«Αν κάνουμε τη δουλειά μας, σωστά, ξέρετε, θα είμαστε βασικό μέρος του τρόπου λειτουργίας κάθε GPU», είπε ο Ντέιβις. Όλοι οι δρόμοι, φαίνεται, περνούν από τα συμπεράσματα.
Latest News
Πόση τεχνητή νοημοσύνη χρησιμοποιούν οι Έλληνες - Τι δείχνει έρευνα της Focus Bari
Στην έρευνα της Focus Bari αναλύονται οι ευκαιρίες, οι κίνδυνοι αλλά και οι μεγάλες προσδοκίες
«Η ανάπτυξη της τεχνητής νοημοσύνης επιτέλους επιβραδύνεται» - Τι προβλέπει τώρα ο CEO της Google
Θα χρειαστεί χρόνος για μια άλλη τεχνολογική ανακάλυψη για να θέσει ξανά την ΑΙ σε εξαιρετικά γρήγορη αναπυτξιακή ταχύτητα, προβλέπει ο CEO της Google Σουντάρ Πιτσάι
Πρώτα βήματα εισαγωγής της Τεχνητής Νοημοσύνης στις σχολικές αίθουσες
Το Αi4edu είναι το πρόγραμμα για την τεχνητή νοημοσύνη που αναπτύσσουν έξι οργανισμοί, από τέσσερα κράτη-μέλη της Ευρωπαϊκής Ένωσης
Η AI «επηρέασε» πωλήσεις 60 δισ. δολαρίων κατά την φετινή Cyber Week
Ρεκόρ πωλήσεων ύψους 314,9 δισ. δολαρίων παγκοσμίως καταγράφηκαν τη φετινή Cyber Week - Το 70% των διαδικτυακών αγορών παγκοσμίως πραγματοποιήθηκε μέσω φορητών συσκευών
Ξηροκώστας (SAP): Τεκτονικές οι αλλαγές που φέρνει στην αγορά η AI
Ο CEO της SAP Hellas, Ανδρέας Ξηροκώστας, στο περιθώριο του ετήσιου «SAP Innovation Day 2024» επισήμανε επίσης «το μεγάλο πρόβλημα της έλλειψης ανθρώπινων πόρων» ειδικά στον κλάδο της τεχνολογίας
Μεγάλο deal στους ημιαγωγούς ΑΙ μεταξύ TSMC - Nvidia για το εργοστάσιο της Αριζόνα
Τι συζητούν TSMC - Nvidia για τους ημιαγωγούς Blackwell και το νέο εργοστάσιο του ταϊβανέζικου τεχνολογικού κολοσσού στην Αριζόνα
Ο θρυλικός Μπιόρν Ουλβέους των ΑΒΒΑ δεν βλέπει με καλό μάτι την ΑΙ
«Πολύ άδικο» για τις εταιρείες τεχνολογίας να χρησιμοποιούν τη δουλειά των καλλιτεχνών χωρίς να τους πληρώνουν, λέει ο θρυλικός Μπιόρν Ουλβέους των ΑΒΒΑ
Παπαστεργίου: Ωραίο αλλά ακριβό σπορ η AI – Συνεργασία με το Υπερταμείο για τον «Φάρο»
Στις πρωτοβουλίες της Ελλάδας στο πεδίο της Τεχνητής Νοημοσύνης αναφέρθηκε κατά τον χαιρετισμό του στο 2ο Growthfund Summit ο υπουργός Ψηφιακής Διακυβέρνησης, Δημήτρης Παπαστεργίου
Στους 300 εκατ. οι ενεργοί χρήστες ανά εβδομάδα για την OpenAI
Κατά τη διάρκεια του επόμενου έτους, η OpenAI φέρεται να στοχεύει σχεδόν στο 4πλάσιο του τρέχοντος αριθμού χρηστών της, στοχεύοντας στο 1 δισεκατομμύριο
Πετάει... η τεχνητή νοημοσύνη - Συνεργασία Google Cloud με Air France-KLM
Η ανάπτυξη τεχνολογίας τεχνητής νοημοσύνης από την Google Cloud θα συμβάλει στη διαχείριση του μεγάλου όγκου από δεδομένα του αεροπορικού ομίλου