DeepSeek: Γιατί καθυστερεί το επόμενο μοντέλο ΑΙ;

Δυσκολίες της startup να εκπαιδεύσει το μοντέλο χρησιμοποιώντας τσιπ της Huawei

DeepSeek: Γιατί καθυστερεί το επόμενο μοντέλο ΑΙ;

Η κινεζική εταιρεία τεχνητής νοημοσύνης DeepSeek καθυστέρησε την κυκλοφορία του νέου της μοντέλου, αφού απέτυχε να το εκπαιδεύσει χρησιμοποιώντας τα τσιπ της Huawei, γεγονός που υπογραμμίζει τα όρια της προσπάθειας του Πεκίνου να αντικαταστήσει την αμερικανική τεχνολογία.

Σύμφωνα με πηγές, που επικαλούνται οι Financial Times, η DeepSeek ενθαρρύνθηκε από τις αρχές να υιοθετήσει τον επεξεργαστή Ascend της Huawei αντί να χρησιμοποιεί τα συστήματα της Nvidia μετά την κυκλοφορία του μοντέλου R1 τον Ιανουάριο.

Ωστόσο, οι ίδιες πηγές τονίζουν, ότι η η κινεζική νεοσύστατη εταιρεία αντιμετώπισε επίμονα τεχνικά προβλήματα κατά τη διάρκεια της διαδικασίας εκπαίδευσης R2 χρησιμοποιώντας τσιπ Ascend, γεγονός που την ώθησε να χρησιμοποιήσει τσιπ Nvidia για εκπαίδευση και τσιπ της Huawei για συμπεράσματα.

Τα προβλήματα ήταν ο κύριος λόγος για τον οποίο η κυκλοφορία του μοντέλου καθυστέρησε από τον Μάιο, δήλωσε ένα άτομο με γνώση της κατάστασης, με αποτέλεσμα να χάσει έδαφος από τους ανταγωνιστές του.

Η εκπαίδευση και τα συμπεράσματα

Η εκπαίδευση περιλαμβάνει την εκμάθηση του μοντέλου από ένα μεγάλο σύνολο δεδομένων, ενώ η συμπερασματολογία αναφέρεται στο βήμα της χρήσης ενός εκπαιδευμένου μοντέλου για την πραγματοποίηση προβλέψεων ή τη δημιουργία μιας απάντησης, όπως ένα ερώτημα chatbot.

Οι δυσκολίες του DeepSeek δείχνουν πώς τα κινεζικά τσιπ εξακολουθούν να υστερούν σε σχέση με τους αμερικανούς ανταγωνιστές τους σε κρίσιμες εργασίες, υπογραμμίζοντας τις προκλήσεις που αντιμετωπίζει η προσπάθεια της Κίνας να είναι τεχνολογικά αυτάρκης.

Οι Financial Times ανέφεραν αυτή την εβδομάδα ότι το Πεκίνο απαίτησε από τις κινεζικές τεχνολογικές εταιρείες να δικαιολογήσουν τις παραγγελίες τους για το H20 της Nvidia, σε μια κίνηση που τις ενθάρρυνε να προωθήσουν εναλλακτικές λύσεις που κατασκευάζουν οι Huawei και Cambricon.

Πηγές της βιομηχανίας έχουν δηλώσει ότι τα κινεζικά τσιπ αντιμετωπίζουν προβλήματα σταθερότητας , πιο αργή συνδεσιμότητα μεταξύ των τσιπ και κατώτερο λογισμικό σε σύγκριση με τα προϊόντα της Nvidia.

Συνεργασία για λυθούν τα προβλήματα

Η Huawei έστειλε μια ομάδα μηχανικών στα γραφεία της DeepSeek για να βοηθήσουν την εταιρεία να χρησιμοποιήσει το τσιπ τεχνητής νοημοσύνης της για την ανάπτυξη του μοντέλου R2, σύμφωνα με δύο άτομα. Ωστόσο, παρά την παρουσία της ομάδας στο χώρο, η DeepSeek δεν μπόρεσε να πραγματοποιήσει μια επιτυχημένη εκπαιδευτική δοκιμή στο τσιπ Ascend, ανέφεραν οι ίδιες πηγές.

Η DeepSeek εξακολουθεί να συνεργάζεται με την Huawei για να καταστήσει το μοντέλο συμβατό με το Ascend για συμπεράσματα, ανέφεραν οι ίδιες πηγές.

Ο ιδρυτής Liang Wenfeng δήλωσε εσωτερικά ότι είναι δυσαρεστημένος με την πρόοδο της R2 και πιέζει να αφιερωθεί περισσότερος χρόνος για να δημιουργηθεί ένα προηγμένο μοντέλο που μπορεί να διατηρήσει το προβάδισμα της εταιρείας στον τομέα της Τεχνητής Νοημοσύνης, ανέφεραν.

Η κυκλοφορία του R2 καθυστέρησε επίσης λόγω της μεγαλύτερης από την αναμενόμενη ημερομηνίας δημοσίευσης των δεδομένων για το ενημερωμένο μοντέλο, πρόσθεσε ένα άλλο άτομο. Δημοσιεύματα των κινεζικών μέσων ενημέρωσης έχουν υπονοήσει ότι το μοντέλο ενδέχεται να κυκλοφορήσει ήδη τις επόμενες εβδομάδες.

«Τα μοντέλα είναι προϊόντα που μπορούν εύκολα να αντικατασταθούν», δήλωσε ο Ritwik Gupta, ερευνητής Τεχνητής Νοημοσύνης στο Πανεπιστήμιο της Καλιφόρνια στο

OT Originals
Περισσότερα από Τεχνολογία

ot.gr | Ταυτότητα

Διαχειριστής - Διευθυντής: Λευτέρης Θ. Χαραλαμπόπουλος

Διευθυντής Σύνταξης: Χρήστος Κολώνας

Ιδιοκτησία - Δικαιούχος domain name: ΟΝΕ DIGITAL SERVICES MONOΠΡΟΣΩΠΗ ΑΕ

Νόμιμος Εκπρόσωπος: Ιωάννης Βρέντζος

Έδρα - Γραφεία: Λεωφόρος Συγγρού αρ 340, Καλλιθέα, ΤΚ 17673

ΑΦΜ: 801010853, ΔΟΥ: ΦΑΕ ΠΕΙΡΑΙΑ

Ηλεκτρονική διεύθυνση Επικοινωνίας: ot@alteregomedia.org, Τηλ. Επικοινωνίας: 2107547007

Μέλος

ened
ΜΗΤ

Aριθμός Πιστοποίησης
Μ.Η.Τ.232433

Απόρρητο