
Το Gemini αποτελείται από τρία διαφορετικά μοντέλα που ποικίλλουν σε μέγεθος και ικανότητα. Το πιο προηγμένο μοντέλο του, το Gemini Ultra δεν είναι ακόμη διαθέσιμο στο κοινό, αλλά η Google λέει ότι είναι σχεδιασμένο για «ιδιαίτερα σύνθετες εργασίες» και ξεπερνά το GPT-4 σε πολλούς τομείς, από τη γνώση θεμάτων όπως ιστορικά και νομικά θέματα μέχρι τη δημιουργία κώδικα στην Python σε εργασίες που απαιτούν συλλογισμό πολλών βημάτων, αναφέρει η Google στην ανακοίνωσή της.
Η Google είπε ότι το Gemini ξεπέρασε το GPT-4 στη δοκιμή Massive Multitask Language Understanding, ή MMLU, η οποία είναι μία από τις πιο δημοφιλείς μεθόδους για τη μέτρηση της γνώσης και των δεξιοτήτων επίλυσης προβλημάτων των μοντέλων AI.
Έρευνα Salesforce: Γιατί είναι απαραίτητη η εκπαίδευση και η καθοδήγηση για την Gen AI
Θα μπορούσατε να το συγκρίνετε με τα “εισαγωγικές εξετάσεις για μοντέλα AI”, είπε ο Κέβιν Ρους στο τεχνολογικό podcast Hard Fork των New York Times. Το MMLU, ωστόσο, είναι λίγο πιο προχωρημένο από τις τυπικές εξετάσεις για εισαγωγή σε πανεπιστήμιο. Καλύπτει 57 μαθήματα, συμπεριλαμβανομένων μαθηματικών, φυσικής, ιστορίας, νομικής, ιατρικής και ηθικής, για να δοκιμάσει τόσο την παγκόσμια γνώση όσο και τις ικανότητες επίλυσης προβλημάτων, σύμφωνα με την ανακοίνωση της Google.
Το Gemini Ultra σημείωσε 90% στο MMLU, ενώ το GPT-4 σημείωσε 86,4%, σύμφωνα με την Google.
Αλλά το πιο εντυπωσιακό κατόρθωμα του Gemini Ultra μπορεί να είναι ότι είναι επίσης το πρώτο μοντέλο που ξεπερνά τους ανθρώπινους ειδικούς στο MMLU. Οι ειδικοί άλαβαν βαθμολογία περίπου 89,8%, ανέφερε η Google σε μια τεχνική έκθεση για τα Gemini.
«Νομίζω ότι αν γυρίζατε έστω και δύο ή τρία χρόνια πίσω και λέγατε σε ερευνητές τεχνητής νοημοσύνης ότι η Google θα έχει ένα μοντέλο που θα έχει ποσοστό 90% στο MMLU, που είναι καλύτερο από το όριο αναφοράς για εξειδικευμένα άτομα, θα έλεγαν, καλά , τότε αυτό είναι το AGI», είπε ο Ρουζ. Το AGI, ή τεχνητή γενική νοημοσύνη, είναι μια υποθετική μορφή τεχνητής νοημοσύνης που μπορεί να επεξεργαστεί περίπλοκες ανθρώπινες ικανότητες όπως η κοινή λογική και η συνείδηση.
Το GPT-4 ξεπέρασε το Gemini Ultra κατά πολλές ποσοστιαίες μονάδες σε μια αξιολόγηση των ικανοτήτων λογικής κοινής λογικής για καθημερινές εργασίες, σύμφωνα με την Google.
Αλλά ένα πλεονέκτημα που λέει η Google ότι το Gemini έχει σε σχέση με άλλα μοντέλα είναι ότι είναι εγγενώς πολυτροπικό, πράγμα που σημαίνει ότι σχεδιάστηκε από την αρχή για να επεξεργάζεται διάφορους τύπους δεδομένων, από κείμενο έως ήχο έως κώδικα έως εικόνες και βίντεο. Άλλα πολυτροπικά μοντέλα δημιουργήθηκαν «συναρμολογώντας» μοντέλα αποκλειστικά κειμένου, αποκλειστικά όρασης και ήχου με «υποβέλτιστο τρόπο», δήλωσε ο Όριολ Βίνιαλς, αντιπρόεδρος έρευνας για το DeepMind της Google, σε ένα βίντεο που ανακοινώνει το Gemini.
Ως αποτέλεσμα, η Google λέει ότι ο σχεδιασμός του Gemini του επιτρέπει να κατανοεί καλύτερα τα εισγόμενα δεδομένα από τα υπάρχοντα πολυτροπικά μοντέλα. Οι ερευνητές πίσω από το ιστολόγιο SemiAnalysis λένε επίσης ότι το Gemini πιθανότατα θα «διαλύσει» το GPT-4 λόγω απόλυτης υπολογιστικής ισχύος.
Ενώ το Gemini Ultra έχει σίγουρα θέσει υψηλές προσδοκίες για την άφιξή του, η κριτική επιτροπή εξακολουθεί να μην γνωρίζει πώς θα τα πάει η τριάδα των μοντέλων Gemini ενάντια στο OpenAI, το οποίο έχει ήδη ένα πλεονέκτημα στην ευαισθητοποίηση των καταναλωτών.
Οι πρώτες αντιδράσεις στο λιγότερο προηγμένο Gemini Pro, το οποίο είναι προσβάσιμο μέσω του chatbot Bard της Google, ήταν θετικές. Ωστόσο, το μοντέλο είχε επίσης προβλήματα με την ακρίβεια και «παραισθήσεις». Έχει πει σε χρήστες ακόμη και να καταφύγουν στη Google για απαντήσεις σε αμφιλεγόμενες ερωτήσεις.


Latest News

Πόσο κοστίζουν τα «ευχαριστώ» και «παρακαλώ» στο ChatGPT
Ο διευθύνων σύμβουλος της OpenAI, Σαμ Όλτμαν, εξήγησε ότι η φράση «η ευγένεια δεν κοστίζει τίποτα» δεν ισχύει ακριβώς στην περίπτωση του ChatGPT.

Γιατί η Samsung επιδιώκει τεχνολογική συμμαχία με κορυφαία πανεπιστήμια των ΗΠΑ
Η πρωτοβουλία έχει σχεδιαστεί για να διευκολύνει τη μετατόπιση του επιχειρηματικού στόχου της Samsung από ακόλουθο σε πρωτοπόρο

Η Silicon Valley θέλει να δημιουργήσει ρομποτικό στρατό για τους «καλούς τύπους» με σύμμαχο την ΑΙ
H Silicon Valley έχει κάνει σημαντική στροφή προς την άμυνα τα τελευταία χρόνια με επενδύσεις εκατοντάδων δισεκατομμυρίων

Η Huawei έτοιμη να προωθήσει προηγμένο τσιπ τεχνητής νοημοσύνης
Το νέο τσιπ τεχνητής νοημοσύνης 910C που ετοιμάζει η Huawei έρχεται τη στιγμή που η Κίνα αναζητά εναλλακτικές λύσεις στα τσιπ της Nvidia

Στις συμπληγάδες ΗΠΑ - Κίνας ο γίγαντας των ημιαγωγών Nvidia - Τι ζητά ο Χουάνγκ στο Πεκίνο;
Ο Τζένσεν Χουάνγκ, CEO της Nvidia, θα απαιτήσει άδειες για να εξάγει το μικροτσίπ H20 AI στην Κίνα

Ιταλική εφημερίδα δημοσίευσε ένθετο γραμμένο από ΑΙ
Μετά τον πρώτο μήνα δοκιμών, η ιταλική εφημερίδα Il Foglio προσέλαβε το σύστημα ως μόνιμο υπάλληλο.

Η Δικαιοσύνη αναβαθμίζεται ψηφιακά με συστήματα AI
Μέχρι σήμερα, η μετάφραση εκατοντάδων, αν όχι χιλιάδων, σελίδων και η αναζήτηση διαθέσιμων μεταφραστών και διερμηνέων, ειδικά σε κάποιες γλώσσες, προκαλεί σημαντικές καθυστερήσεις

Ξεκινά η υλοποίηση του ελληνικού εργοστασίου τεχνητής νοημοσύνης
Το AI Factory «Pharos» είναι ένα από τα πρώτα δεκατρία «εργοστάσια» Τεχνητής Νοημοσύνης στην Ευρώπη

Η TDK φέρνει επανάσταση στη δημιουργική ΑΙ
Η TDK κατέγραψε χρόνους απόκρισης 20 τρισεκατομμυρίων του δευτερολέπτου στη δοκιμή για τη βελτίωση των ταχυτήτων μεταφοράς δεδομένων

Ξεπέρασαν τις 15.000 οι επισκέπτες στη Beyond 2025
Η BEYOND 2025 συγκέντρωσε περισσότερους από 300 εκθέτες από την Ελλάδα και από 10 χώρες