DeepSeek: Ανέπτυξε AI μοντέλο με μόλις 294.000 δολάρια

Το DeepSeek αποκαλύπτει το κόστος εκπαίδευσης του νέου AI μοντέλου του, προκαλώντας συζητήσεις για τον παγκόσμιο ανταγωνισμό στην τεχνητή νοημοσύνη

DeepSeek: Ανέπτυξε AI μοντέλο με μόλις 294.000 δολάρια

Σε μια εποχή που η ανάπτυξη της τεχνητής νοημοσύνης μετριέται σε δισεκατομμύρια, μια κινεζική startup από το Χανγκζού έρχεται να ανατρέψει τα δεδομένα.

Το DeepSeek ανακοίνωσε ότι η εκπαίδευση του μοντέλου του, R1, κόστισε λιγότερο από 300.000 δολάρια – ποσό που μοιάζει αμελητέο σε σύγκριση με τα εκατομμύρια που ξοδεύουν οι αμερικανικοί κολοσσοί.

Η αποκάλυψη αυτή, που δημοσιεύτηκε εχθές στο έγκριτο επιστημονικό περιοδικό Nature, άνοιξε νέο γύρο αντιπαράθεσης για το πού στέκεται η Κίνα στη διεθνή κούρσα της AI.

DeepSeek: Η «έκπληξη» των αριθμών

Σύμφωνα με την έρευνα που υπέγραψε και ο ιδρυτής της εταιρείας, Λιανγκ Γουενφένγκ, το DeepSeek-R1 εκπαιδεύτηκε με τη χρήση 512 επεξεργαστών Nvidia H800, μέσα σε μόλις 80 ώρες.

Το συνολικό κόστος ανήλθε στα 294.000 δολάρια.

Για να γίνει η σύγκριση, το Reuters μας υπενθυμίζει σε σχετικό θέμα ότι ο Σαμ Άλτμαν της OpenAI είχε δηλώσει πως η εκπαίδευση θεμελιωδών μοντέλων ξεπερνά κατά πολύ τα 100 εκατομμύρια δολάρια.

Από την αφάνεια στο προσκήνιο

Το DeepSeek είχε ήδη ταράξει τις αγορές στις αρχές του 2025, όταν παρουσίασε οικονομικότερα μοντέλα AI, προκαλώντας πανικό σε επενδυτές που φοβήθηκαν πως η κυριαρχία εταιρειών όπως η Nvidia θα δεχτεί σοβαρό πλήγμα.

Έπειτα, η εταιρεία κράτησε χαμηλό προφίλ, με ελάχιστες δημόσιες εμφανίσεις και ανακοινώσεις.

Το ζήτημα με τα chips

Το ενδιαφέρον δεν περιορίζεται μόνο στο κόστος. Οι ΗΠΑ έχουν απαγορεύσει από το 2022 την εξαγωγή των πανίσχυρων H100 και A100 chips προς την Κίνα.

Έτσι, η Nvidia σχεδίασε ειδικά τα H800 για την κινεζική αγορά.

Ωστόσο, αμερικανικές πηγές υποστηρίζουν ότι το DeepSeek διαθέτει «μεγάλες ποσότητες» H100, ενώ σε συνοδευτικό έγγραφο της έρευνας η ίδια η εταιρεία παραδέχεται ότι χρησιμοποιήθηκαν A100 σε δοκιμαστικά στάδια.

Ένας νέος παίκτης με φιλοδοξίες

Η στρατηγική του DeepSeek δεν αφορά μόνο το χαμηλό κόστος, αλλά και την ικανότητα να προσελκύει κορυφαία ταλέντα της Κίνας χάρη σε προηγμένα υπολογιστικά συστήματα.

Το γεγονός ότι μπορεί να ανταγωνίζεται γίγαντες της Silicon Valley με κλάσμα του προϋπολογισμού τους, ανατρέπει τα δεδομένα και δημιουργεί νέα ερωτήματα για την επόμενη μέρα της τεχνητής νοημοσύνης.

OT Originals
Περισσότερα από World

ot.gr | Ταυτότητα

Διαχειριστής - Διευθυντής: Λευτέρης Θ. Χαραλαμπόπουλος

Διευθυντής Σύνταξης: Χρήστος Κολώνας

Ιδιοκτησία - Δικαιούχος domain name: ΟΝΕ DIGITAL SERVICES MONOΠΡΟΣΩΠΗ ΑΕ

Νόμιμος Εκπρόσωπος: Ιωάννης Βρέντζος

Έδρα - Γραφεία: Λεωφόρος Συγγρού αρ 340, Καλλιθέα, ΤΚ 17673

ΑΦΜ: 801010853, ΔΟΥ: ΦΑΕ ΠΕΙΡΑΙΑ

Ηλεκτρονική διεύθυνση Επικοινωνίας: ot@alteregomedia.org, Τηλ. Επικοινωνίας: 2107547007

Μέλος

ened
ΜΗΤ

Aριθμός Πιστοποίησης
Μ.Η.Τ.232433

Απόρρητο