Φτάσαμε στην τελική ευθεία του EURO 2020. Η φάση των προ-ημιτελικών κύλισε πιο ομάλα και πιο αναμενόμενα από την προηγούμενη φάση.

Οι Προβλέψεις του Μοντέλου για την προ-ημιτελική φάση

Οι προβλέψεις του μοντέλου συνοψίζονται στον πίνακα που ακολουθεί. Μαζί με τις πιθανότητες κάθε αποτελέσματος δίνεται και το σκορ με την μεγαλύτερη πιθανότητα εμφάνισης (η αντίστοιχη πιθανότητα δίνεται σε παρένθεση) και ο αναμενόμενος αριθμός γκολ της κάθε ομάδας (με δύο δεκαδικά). Οι διαφορές των αναμενόμενων αριθμών των γκολ είναι μικρότερες της μονάδας (0.51 και 0.60 αντίστοιχα) λόγω των μικρών διαφορών μεταξύ των αντίπαλων ομάδων.

Με βάση τα παραπάνω αποτελέσματα βλέπουμε ότι η ότι και οι δύο αγώνες είναι σχετικά αμφίρροποι με ελαφρύ προβάδισμα της Ιταλίας επί της Ισπανίας και της Αγγλίας επί της Δανίας. Πιο συγκεκριμένα η Ιταλία έχει ελαφρύ προβάδισμα νίκης επί της Ισπανίας με πιθανότητα νίκης 49% ενώ η πιθανότητα να πάει ο αγώνας στην παράταση ή να νικήσει η Ισπανίας είναι ίση με 51%. Παρόμοια, η Αγγλία έχει ένα μικρό προβάδισμα νίκης με 50.5% επί της Δανίας, όμως η πιθανότητα παράτασης ή νίκης της Δανίας είναι ίση 49.5%.

Στα ακόλουθα διαγράμματα απεικονίζονται οι πιθανότητες κάθε σκορ για κάθε αγώνα. Τα πιο σκούρα κουτάκια απεικονίζουν τα πιο πιθανά αποτελέσματα ενώ τα πιο ανοικτόχρωμα υποδεικνύουν αποτελέσματα με χαμηλή πιθανότητα εμφάνισης.

Το ακόλουθο διάγραμμα απεικονίζει την εξέλιξη της επιθετικής (με κόκκινο) και της αμυντικής (με μπλε) δύναμικότητας της κάθε ομάδας. Βλέπουμε ξεκάθαρα ότι η Ιταλία και η Αγγλία έχουν μεγάλη αναχαιτιστική ικανότητα (η αντίστοιχη παράμετρος είναι μεγάλη και ίση με -0.3). Αντίθετα η Δανία έχει την καλύτερη επιθετική δυναμικότητα όμως με τη χειρότερη αμυντική δυναμικότητα. Τέλος οι άλλες 3 ομάδες φαίνονται να είναι κοντά όσον αφορά την επιθετική δυναμικότητα με βάση τις εκτιμήσεις του μοντέλου.

To φαβορί για την κατάκτηση του EURO 2020

Τέλος το μοντέλο δίνει ως φαβορί για την κατάκτηση του EURO 2020 την Ιταλία με πιθανότητα 34% και ελαφρύ προβάδισμα επί της Αγγλίας που έχει πιθανότητα 29%. Η Ισπανία έχει πιθανότητα κατάκτησης του EURO 2020 22% και η Δανία τέταρτη με πιθανότητα μόλις 14%.

Λίγα λόγια για το μοντέλο

Η τεχνική αλλά και τέχνη στατιστικής μοντελοποίησης  έχει άμεση εφαρμογή στον τομέα του αθλητισμού και πιο συγκεκριμένα του ποδοσφαίρου με άμεση εφαρμογή στην λήψη αξιόπιστων προβλέψεων σε μελλοντικούς αγώνες ποδοσφαίρου όπου το ενδιαφέρον των φιλάθλων αυξάνει κατακόρυφα.

Η χρήση στατιστικών τεχνικών για την πρόβλεψη αγώνων ποδοσφαίρου πρώτο-εμφανίστηκε στην επιστημονική βιβλιογραφία το 1968 με την πρωτοπόρα επιστημονική δημοσίευση των Reep & Benjamin. Οι επόμενες πραγματικές καινοτομίες εμφανίζονται στη δεκαετία του 80 με την εργασία του Michael Maher και την εργασία του Lee το 1997  όπου έθετε το ερώτημα αν πράγματι η Μάντσεστερ Γιουνάιτεντ τότε ήταν πράγματι η καλύτερη ομάδα. Το ερώτημα επιβεβαιώνονταν με την χρήση ενός απλοϊκού στατιστικού μοντέλου και προσομοίωσης. Η ανάλυση αυτή έθετε τα θεμέλια της σύγχρονης μοντελοποίησης στο Ποδόσφαιρο και στον αθλητισμό.  Επόμενες σημαντικές δημοσιεύσεις ήταν οι εργασίες των Dixon & Coles το 1997 και το διμεταβλητό μοντέλο Poisson των Καρλή και Ντζούφρα το 2003 (δύο από τους συγγραφείς της συγκεκριμένης ανάλυσης). Τα δύο αυτά μοντέλα έθεσαν τη βάση των συγχρόνων μοντέλων πρόβλεψης των αποτελεσμάτων αγώνων ποδοσφαίρου.

Η βασική ιδέα του στατιστικού μοντέλου των καθηγητών του ΟΠΑ Καρλή και Ντζούφρα βασίζεται σε μια επέκταση μια γνωστής κατανομής που ονομάζεται Poisson για την πρόβλεψη του αριθμού των γκολ που θα σκοράρει κάθε ομάδα. Ο προβλεπόμενος αριθμός γκολ γράφεται ως συνάρτηση της επίδρασης της έδρας (home effect) που πλέον μπορεί να ποσοτικοποιηθεί και της επιθετικής και αμυντικής δυναμικότητας  των ομάδων. Εδώ γίνεται χρήση μιας παραλλαγής αυτού του μοντέλου για να γίνει πρόβλεψη των αγώνων του EURO 2020. Επιπλέον χρησιμοποιούνται χρονό-δυναμικές παράμετροι που αντικατοπτρίζουν τις δυναμικότητες ομάδων και η διαφορά στο ranking μεταξύ των δύο αντίπαλων ομάδων με βάση τον δείκτη Coca-Cola FIFA ranking την 27η Μαΐου 2021. Το μοντέλο εκτιμήθηκε με χρήση της Μπευζιανής προσέγγισης (Bayesian approach) με του στατιστικών πακέτων R και STAN. Οι προβλέψεις αυτές είναι παρόμοιας ακρίβειας με αυτές που χρησιμοποιούν οι εταιρείες στοιχηματισμού.

·         i είναι ο δείκτης του αγώνα

·          και  είναι ο αριθμός των γκολ μεταξύ της 1ης και της 2ης ομάδας στον αγώνα i

·          είναι η επίδραση της έδρας (μόνο για τους αγώνες που ισχύει αυτό). Συνήθως στο EURO οι περισσότεροι αγώνες είναι σε ουδέτερη έδρα οπότε αυτό το bonus δεν προστίθεται σε καμία από τις δύο αντίπαλες ομάδες

·          και  είναι η 1η και 2η ομάδα αντίστοιχα (ή η εντός και εκτός έδρα ομάδα – όπου ισχύει) για τον i αγώνα.

·          και  οι παράμετροι που εκτιμούν της επιθετική και αμυντική δυναμικότητα/ ικανότητα της ομάδας k την χρονική στιγμή t (δυναμικές παράμετροι που αλλάζουν στο χρόνο)

·          δείκτης Coca-Cola FIFA ranking την 27η Μαΐου 2021 για την ομάδα k.

·          είναι η επίδραση του Coca-Cola FIFA ranking στο λογάριθμο των αναμενόμενων γκολ

Οι προβλέψεις γίνονται για επιστημονικούς λόγους και δεν συνιστούν προτροπή ή συμβουλή για στοιχηματισμό.

Βιβλιογραφία για διαβαστερούς φιλάθλους

·         Dixon, M.J. and Coles, S.G. (1997), Modelling Association Football Scores and Inefficiencies in the Football Betting Market. Journal of the Royal Statistical Society: Series C (Applied Statistics), 46, 265-280.

·         Karlis, D. and Ntzoufras, I. (2003), Analysis of sports data by using bivariate Poisson models. Journal of the Royal Statistical Society: Series D (The Statistician), 52, 381-393.

·         Lee A.J. (1997). Modeling Scores in the Premier League: Is Manchester United Really the Best?  Chance, 10, 15-19.

·         Maher, M.J. (1982), Modelling association football scores. Statistica Neerlandica, 36, 109-118.

·         Reep, C., & Benjamin, B. (1968). Skill and Chance in Association Football. Journal of the Royal Statistical Society. Series A (General), 131, 581-585.

Λίγα λόγια για τους Συγγραφείς

O Leonardo Egidi είναι επίκουρος καθηγητής Στατιστικής στο Πανεπιστήμιο της Τεργέστης στην Ιταλία και μέλος της ερευνητικής ομάδας του Οικονομικού Πανεπιστημίου Αθηνών AUEB Sports Analytics Group. Έχει διδακτορικό στην μοντελοποιηση και αναλυτική ποδοσφαίρου και έντονη ερευνητική δραστηριότητα στη Μπευζιανή Στατιστική μεθοδολογία.

O Ιωάννης Ντζουφρας είναι καθηγητής Στατιστικής και πρόεδρος στο Τμήμα Στατιστικής του Οικονομικού Πανεπιστημίου Αθηνών. Είναι ιδρυτικό μέλος της ερευνητικής ομάδας AUEB Sports Analytics Group μαζί με τον Δημήτρη Καρλή. Έχει αναγνωρισμένη επιστημονική δραστηριότητα σε τομείς όπως η Μπευζιανή στατιστική μεθοδολογία, υπολογιστική στατιστική, Βιοστατιστική, ψυχομετρία και αναλυτική των σπορ.

O Δημήτρης Καρλής είναι καθηγητής Στατιστικής και αναπληρωτής πρόεδρος στο Τμήμα Στατιστικής του Οικονομικού Πανεπιστημίου Αθηνών. Είναι ιδρυτικό μέλος της ερευνητικής ομάδας AUEB Sports Analytics Group μαζί με τον Ιωάννη Ντζούφρα. Έχει αναγνωρισμένη επιστημονική δραστηριότητα σε τομείς όπως η στατιστική μεθοδολογία, υπολογιστική στατιστική, Βιοστατιστική, και αναλυτική των σπορ.

Οι τρεις συγγραφείς του άρθρου αυτή τη στιγμή συνεργάζονται για τη συγγραφή ενός βιβλίου σε Football Analytics σε διεθνή επιστημονικό οίκο ενώ στο τελευταίο workshop της ομάδας έδωσαν ένα σεμιναριακό μάθημα σε Football analytics.

Η ερευνητική ομάδα του Οικονομικού Πανεπιστημίου Αθηνών AUEB Sports Analytics Group ιδρύθηκε το 2015 από τους καθηγητές Ιωάννη Ντζούφρα και Δημήτρη Καρλή. Μέλη του είναι σημαντικά μέλη της κοινότητα της αναλυτικής των σπορ όπως οι Stefan Kesenne (Πανεπιστήμιο Antwerp & Leuven), Leonardo Egidi (Πανεπιστήμιο Trieste), Ιωάννης Κοσμίδης (Warwick), Κωνσταντίνος Πελεχρίνης (Pittsburg), Nial Friel (UCD) και Gianluca Baio (UCL) καθώς επίσης και ο πρώην προπονητής της εθνικής Ελλάδας Βόλεϊ, Σωτήρης Δρίκος. Η ερευνητική ομάδα είναι υπεύθυνη για της σειρά ετήσιων συνεδρίων με το όνομα AUEB Sports Analytics Workshop (5 συνολικά) ενώ το 2019 διοργάνωσε το διεθνές συνέδριο MathSport 2019 με 200 συμμετέχοντες επιστήμονες από όλο τον κόσμο. Τέλος η ομάδα έχει μια σειρά από σημαντικές επιστημονικές δημοσιεύσεις στο χώρο της αναλυτικής των σπορ.

Ακολουθήστε τον ot.grστο Google News και μάθετε πρώτοι όλες τις ειδήσεις
Δείτε όλες τις τελευταίες Ειδήσεις από την Ελλάδα και τον Κόσμο, στον ot.gr

Latest News