Τεχνητή νοημοσύνη: Νέο κινεζικό μοντέλο AI δηλώνει «φθηνότερο» από το DeepSeek

Το νέο μοντέλο που ανταγωνίζεται αυτό της DeepSeek είναι επίσης ανοιχτού κώδικα, που σημαίνει ότι είναι δωρεάν για λήψη και χρήση από τους προγραμματιστές

Τεχνητή νοημοσύνη: Νέο κινεζικό μοντέλο AI δηλώνει «φθηνότερο» από το DeepSeek

Η νεοφυής κινεζική εταιρεία Z.ai, γνωστή παλαιότερα ως Zhipu, ανακοίνωσε τη Δευτέρα ότι το νέο μοντέλο τεχνητής νοημοσύνης GLM-4.5 θα κοστίζει λιγότερο από το DeepSeek. Σε αντίθεση με τη λογική που διέπει τα υπάρχοντα μοντέλα τεχνητής νοημοσύνης, η Z.ai δήλωσε ότι το νέο της GLM-4.5 βασίζεται σε αυτό που είναι γνωστό ως «πρακτική» τεχνητή νοημοσύνη, που σημαίνει ότι το μοντέλο αναλύει αυτόματα μια εργασία σε υποεργασίες προκειμένου να την ολοκληρώσει με μεγαλύτερη ακρίβεια.

Το νέο μοντέλο είναι επίσης ανοιχτού κώδικα, που σημαίνει ότι είναι δωρεάν για λήψη και χρήση από τους προγραμματιστές. Με περίπου το μισό μέγεθος από το μοντέλο του DeepSeek, το GLM-4.5 χρειάζεται μόνο οκτώ επεξεργαστές της Nvidia. Τα τσιπ H20 θα λειτουργήσουν, δήλωσε ο διευθύνων σύμβουλος της Z.ai, Ζανγκ Πενγκ, στο CNBC.

Πρόκειται για το τσιπ που η Nvidia προσάρμοσε για την Κίνα, προκειμένου να συμμορφωθεί με τους ελέγχους εξαγωγών των ΗΠΑ. Η αμερικανική εταιρεία εκτίμησε αυτόν τον μήνα ότι οι ΗΠΑ θα της επιτρέψουν να επαναλάβει τις πωλήσεις στην Κίνα μετά από μια τρίμηνη παύση, αλλά δεν είναι σαφές πότε θα ξεκινήσουν αυτές οι αποστολές.

Ο Ζανγκ είπε ότι η εταιρεία δεν χρειάζεται να αγοράσει περισσότερα από τα τσιπ, καθώς προς το παρόν διαθέτει αρκετή υπολογιστική ισχύ, αλλά αρνήθηκε να ανακοινώσει το κόστος ανάπτυξης που δαπάνησε η Z.ai για την εκπαίδευση του μοντέλου τεχνητής νοημοσύνης. Λεπτομέρειες θα δημοσιευτούν αργότερα, είπε.

Το κόστος του μοντέλου

Τον Ιανουάριο, η DeepSeek είχε σοκάρει (κυρίως) τους επενδυτές παγκοσμίως με την προφανή ικανότητά της να αψηφά τους περιορισμούς στα τσιπ των ΗΠΑ και να δημιουργεί ένα μοντέλο τεχνητής νοημοσύνης που όχι μόνο ανταγωνιζόταν το ChatGPT της αμερικανικής OpenAI, αλλά και το υποβάθμιζε σε κόστος εκπαίδευσης και λειτουργίας.

Η DeepSeek ισχυρίστηκε ότι το κόστος εκπαίδευσης για το μοντέλο V3 ήταν λιγότερο από 6 εκατομμύρια δολάρια, αν και ορισμένοι αναλυτές δήλωσαν ότι το ποσό αυτό βασίστηκε στις δαπάνες της εταιρείας για υλικό, οι οποίες ξεπέρασαν τα 500 εκατομμύρια δολάρια με την πάροδο του χρόνου.

Η Z.ai δήλωσε ότι για το νέο μοντέλο GLM-4.5, θα χρεώνει 11 σεντς ανά εκατομμύριο tokens εισόδου έναντι 14 για το DeepSeek R1 και 28 σεντς ανά εκατομμύριο tokens εξόδου έναντι 2,19 δολαρίων για το DeepSeek. Τα tokens είναι ένας τρόπος μέτρησης δεδομένων για την επεξεργασία μοντέλων τεχνητής νοημοσύνης.

Μέσα στον Ιούλιο, η Moonshot, η οποία υποστηρίζεται από την Alibaba, κυκλοφόρησε το Kimi K2 , το οποίο ισχυρίστηκε ότι ξεπέρασε το ChatGPT της OpenAI και το Claude της Anthropic σε ορισμένες δυνατότητες κωδικοποίησης. Το Kimi K2 χρεώνει 15 σεντς για κάθε 1 εκατομμύριο tokens εισόδου και 2,50 δολάρια ανά 1 εκατομμύριο tokens εξόδου, σύμφωνα με την ιστοσελίδα της εταιρείας.

Στα τέλη Ιουνίου, η OpenAI κατονόμασε την Zhipu σε μια προειδοποίηση σχετικά με την πρόοδο της κινεζικής τεχνητής νοημοσύνης. Οι ΗΠΑ έχουν επίσης προσθέσει την startup επιχείρηση στον κατάλογο οντοτήτων που απαγορεύει στις αμερικανικές εταιρείες να συνεργάζονται μαζί της.

Αρχική δημόσια προσφορά

Η Z.ai ξεκίνησε το 2019 και σύμφωνα με πληροφορίες σχεδιάζει μια αρχική δημόσια προσφορά στην ευρύτερη περιοχή της Κίνας.

Η κινεζική startup έχει συγκεντρώσει περισσότερα από 1,5 δισεκατομμύρια δολάρια από επενδυτές, συμπεριλαμβανομένων των Alibaba, Tencent και Qiming Venture Partners, σύμφωνα με το PitchBook. Η Prosperity7 Ventures, η οποία υποστηρίζεται από την Aramco, καθώς και δημοτικά κεφάλαια από τις πόλεις Hangzhou και Chengdu, είναι επίσης μεταξύ των υποστηρικτών της Z.ai, σύμφωνα με τη βάση δεδομένων.

Τις τελευταίες εβδομάδες, αρκετές άλλες κινεζικές εταιρείες έχουν ανακοινώσει νέα μοντέλα τεχνητής νοημοσύνης ανοιχτού κώδικα. Κατά τη διάρκεια του Παγκόσμιου Συνεδρίου Τεχνητής Νοημοσύνης στη Σαγκάη, η Tencent κυκλοφόρησε το μοντέλο HunyuanWorld-1.0 για τη δημιουργία τρισδιάστατων σκηνών για την ανάπτυξη παιχνιδιών. Την περασμένη εβδομάδα, η Alibaba ανακοίνωσε το μοντέλο Qwen3-Coder για τη σύνταξη κώδικα υπολογιστή.

OT Originals
Περισσότερα από Tεχνητή νοημοσύνη

ot.gr | Ταυτότητα

Διαχειριστής - Διευθυντής: Λευτέρης Θ. Χαραλαμπόπουλος

Διευθυντής Σύνταξης: Χρήστος Κολώνας

Ιδιοκτησία - Δικαιούχος domain name: ΟΝΕ DIGITAL SERVICES MONOΠΡΟΣΩΠΗ ΑΕ

Νόμιμος Εκπρόσωπος: Ιωάννης Βρέντζος

Έδρα - Γραφεία: Λεωφόρος Συγγρού αρ 340, Καλλιθέα, ΤΚ 17673

ΑΦΜ: 801010853, ΔΟΥ: ΦΑΕ ΠΕΙΡΑΙΑ

Ηλεκτρονική διεύθυνση Επικοινωνίας: ot@alteregomedia.org, Τηλ. Επικοινωνίας: 2107547007

Μέλος

ened
ΜΗΤ

Aριθμός Πιστοποίησης
Μ.Η.Τ.232433

Απόρρητο