
Σε μια προσπάθεια να μειώσει το λειτουργικό κόστος, η κινεζική DeepSeek που «τάραξε τα νερά» στο χώρο της ΑΙ , συνεργάζεται με το Πανεπιστήμιο Tsinghua για τη μείωση της εκπαίδευσης που χρειάζονται τα μοντέλα τεχνητής νοημοσύνης της.
Η κινεζική startup, η οποία αναστάτωσε τις αγορές με το χαμηλού κόστους μοντέλο συλλογιστικής που εμφανίστηκε τον Ιανουάριο, συνεργάστηκε με ερευνητές από το ίδρυμα του Πεκίνου σε ένα έγγραφο που περιγράφει λεπτομερώς μια νέα προσέγγιση στην ενισχυτική μάθηση για να γίνουν τα μοντέλα πιο αποδοτικά.
Η νέα μέθοδος έχει ως στόχο να βοηθήσει τα μοντέλα τεχνητής νοημοσύνης να τηρούν καλύτερα τις ανθρώπινες προτιμήσεις, προσφέροντας ανταμοιβές για πιο ακριβείς και κατανοητές απαντήσεις, έγραψαν οι ερευνητές.
Η ενισχυτική μάθηση έχει αποδειχθεί αποτελεσματική στην επιτάχυνση των εργασιών της τεχνητής νοημοσύνης σε στενές εφαρμογές και τομείς. Ωστόσο, η επέκτασή της σε πιο γενικές εφαρμογές έχει αποδειχθεί πρόκληση – και αυτό είναι το πρόβλημα που προσπαθεί να λύσει η ομάδα της DeepSeek με κάτι που αποκαλεί ρύθμιση κριτικής με βάση τις αρχές του εαυτού της.
Καλύτερες επιδόσεις
Η στρατηγική ξεπέρασε τις υπάρχουσες μεθόδους και μοντέλα σε διάφορα benchmarks και το αποτέλεσμα έδειξε καλύτερες επιδόσεις με λιγότερους υπολογιστικούς πόρους, σύμφωνα με το έγγραφο που επικαλείται το Bloomberg.
Η DeepSeek ονομάζει αυτά τα νέα μοντέλα DeepSeek-GRM – συντομογραφία για τη «γενικευμένη μοντελοποίηση ανταμοιβής» – και θα τα κυκλοφορήσει σε βάση ανοιχτού κώδικα, δήλωσε η εταιρεία.
Άλλοι προγραμματιστές τεχνητής νοημοσύνης, συμπεριλαμβανομένου του κινεζικού τεχνολογικού γίγαντα Alibaba Group Holding Ltd. και της OpenAI με έδρα το Σαν Φρανσίσκο, προωθούνται επίσης σε ένα νέο σύνορο βελτίωσης της συλλογιστικής και των δυνατοτήτων αυτο-αναβάθμισης, ενώ ένα μοντέλο τεχνητής νοημοσύνης εκτελεί εργασίες σε πραγματικό χρόνο.
Η Meta Platforms Inc. με έδρα το Menlo Park της Καλιφόρνιας κυκλοφόρησε την τελευταία οικογένεια μοντέλων τεχνητής νοημοσύνης, το Llama 4, το Σαββατοκύριακο και τα χαρακτήρισε ως τα πρώτα που χρησιμοποιούν την αρχιτεκτονική Mixture of Experts (MoE).
Τα μοντέλα της DeepSeek βασίζονται σημαντικά στην MoE για την αποδοτικότερη χρήση των πόρων και η Meta έκανε συγκριτική αξιολόγηση της νέας της έκδοσης με τη νεοσύστατη εταιρεία με έδρα την Hangzhou. Η DeepSeek δεν έχει διευκρινίσει πότε μπορεί να κυκλοφορήσει το επόμενο μοντέλο-ναυαρχίδα της.


Latest News

Πόσο κοστίζουν τα «ευχαριστώ» και «παρακαλώ» στο ChatGPT
Ο διευθύνων σύμβουλος της OpenAI, Σαμ Όλτμαν, εξήγησε ότι η φράση «η ευγένεια δεν κοστίζει τίποτα» δεν ισχύει ακριβώς στην περίπτωση του ChatGPT.

Γιατί η Samsung επιδιώκει τεχνολογική συμμαχία με κορυφαία πανεπιστήμια των ΗΠΑ
Η πρωτοβουλία έχει σχεδιαστεί για να διευκολύνει τη μετατόπιση του επιχειρηματικού στόχου της Samsung από ακόλουθο σε πρωτοπόρο

Η Silicon Valley θέλει να δημιουργήσει ρομποτικό στρατό για τους «καλούς τύπους» με σύμμαχο την ΑΙ
H Silicon Valley έχει κάνει σημαντική στροφή προς την άμυνα τα τελευταία χρόνια με επενδύσεις εκατοντάδων δισεκατομμυρίων

Η Huawei έτοιμη να προωθήσει προηγμένο τσιπ τεχνητής νοημοσύνης
Το νέο τσιπ τεχνητής νοημοσύνης 910C που ετοιμάζει η Huawei έρχεται τη στιγμή που η Κίνα αναζητά εναλλακτικές λύσεις στα τσιπ της Nvidia

Στις συμπληγάδες ΗΠΑ - Κίνας ο γίγαντας των ημιαγωγών Nvidia - Τι ζητά ο Χουάνγκ στο Πεκίνο;
Ο Τζένσεν Χουάνγκ, CEO της Nvidia, θα απαιτήσει άδειες για να εξάγει το μικροτσίπ H20 AI στην Κίνα

Ιταλική εφημερίδα δημοσίευσε ένθετο γραμμένο από ΑΙ
Μετά τον πρώτο μήνα δοκιμών, η ιταλική εφημερίδα Il Foglio προσέλαβε το σύστημα ως μόνιμο υπάλληλο.

Η Δικαιοσύνη αναβαθμίζεται ψηφιακά με συστήματα AI
Μέχρι σήμερα, η μετάφραση εκατοντάδων, αν όχι χιλιάδων, σελίδων και η αναζήτηση διαθέσιμων μεταφραστών και διερμηνέων, ειδικά σε κάποιες γλώσσες, προκαλεί σημαντικές καθυστερήσεις

Ξεκινά η υλοποίηση του ελληνικού εργοστασίου τεχνητής νοημοσύνης
Το AI Factory «Pharos» είναι ένα από τα πρώτα δεκατρία «εργοστάσια» Τεχνητής Νοημοσύνης στην Ευρώπη

Η TDK φέρνει επανάσταση στη δημιουργική ΑΙ
Η TDK κατέγραψε χρόνους απόκρισης 20 τρισεκατομμυρίων του δευτερολέπτου στη δοκιμή για τη βελτίωση των ταχυτήτων μεταφοράς δεδομένων

Ξεπέρασαν τις 15.000 οι επισκέπτες στη Beyond 2025
Η BEYOND 2025 συγκέντρωσε περισσότερους από 300 εκθέτες από την Ελλάδα και από 10 χώρες