Μόλις τον Δεκέμβριο του 2021 ο Ζιάντ Ομπερμάγερ, φυσικός επιστήμονας του Πανεπιστημίου Μπέρκλεϊ της Καλιφόρνια με ειδίκευση στην Τεχνητή Νοημοσύνη, έθεσε σε εφαρμογή το πρόγραμμα Nightingale Open Science. Πρόκειται για ένα θησαυρό μοναδικών στατιστικών στοιχείων ασθενών, που τους βοήθησε να ιαθούν καθώς έλυσε, με τη βοήθεια της τεχνητής νοημοσύνης, άλυτα ιατρικά «μυστήρια» που τους ταλαιπωρούσαν.

Τα σύνολα δεδομένων του Nightingale Open Science, που κυκλοφόρησαν αφότου το έργο έλαβε χρηματοδότηση 2 εκατ. δολαρίων από τον πρώην διευθύνοντα σύμβουλο της Google Έρικ Σμιντ, θα μπορούσαν να βοηθήσουν στη δημιουργία αλγορίθμων υπολογιστών που θα προβλέπουν και θα αξιολογούν εγκαίρως κρίσιμες καταστάσεις ασθενών και ως εκ τούτου θα τους σώζουν τη ζωή.

Τα δεδομένα περιλαμβάνουν 40 terabyte ιατρικών απεικονιστικών, μικροβιολογικών και άλλων εξετάσεων, όπως ακτίνες Χ, κυματομορφές ηλεκτροκαρδιογραφημάτων και παθολογικά ευρήματα από ασθενείς με μια σειρά παθήσεων, όπως είναι ο καρκίνος του μαστού, ξαφνικές καρδιακές ανακοπές, κατάγματα και Covid-19. Κάθε εικόνα συνοδεύεται με κρίσιμα στοιχεία που αφορούν τον ασθενή, αποκαλύπτοντας το καθοριστικό για την επιβίωση στάδιο του καρκίνου του μαστού, αλλά και αν ένας ασθενής με Covid χρειάζεται διασωλήνωση.

Ο Ομπερμάγερ εξασφάλισε νομικά την ελεύθερη χρήση των δεδομένων που συνέλεξε και ομαδοποίησε, έχοντας συνεργαστεί για διάστημα δύο ετών με νοσοκομεία στις ΗΠΑ και την Ταϊβάν. Τους επόμενους μήνες σκοπεύει να εμπλουτίσει τις βάσεις δεδομένων του με στοιχεία από την Κένυα και τον Λίβανο, ώστε να αποτυπώνεται όσο το δυνατόν ακριβέστερα η ιατρική ποικιλομορφία.

«Δεν έχει ξαναγίνει στο παρελθόν κάτι τέτοιο», τόνισε ο Obermeyer, ο οποίος παρουσίασε τη δουλειά του τον Δεκέμβριο μαζί με συναδέλφους του στο NeurIPS, την παγκόσμια ακαδημαϊκή συνδιάσκεψη για την τεχνητή νοημοσύνη. Όπως διευκρίνισε, αυτό που ξεχωρίζει τη δουλειά του από ο,τιδήποτε άλλο είναι διαθέσιμο στο Διαδίκτυο, είναι ότι τα σύνολα των δεδομένων φέρουν την ένδειξη «βασική αλήθεια». Κάτι που σημαίνει ότι δεν παρατίθεται μόνο η γνώμη ενός γιατρού, αλλά τι πραγματικά συνέβη σε έναν ασθενή.

Δηλαδή τα σύνολα δεδομένων για τα ηλεκτροκαρδιογραφήματα καρδιακής ανακοπής, για παράδειγμα, δεν έχουν επισημανθεί ανάλογα με το αν ένας καρδιολόγος εντόπισε κάτι ύποπτο, αλλά με το εάν ο ασθενής τελικά υπέστη καρδιακή προσβολή. «Μπορούμε να μάθουμε από τα πραγματικά αποτελέσματα των ασθενών, αντί να αναπαράγουμε την ανθρώπινη κρίση, που μπορεί να είναι και λανθασμένη», είπε ο Obermeyer.

Την χρονιά που πέρασε η έμφαση και το ενδιαφέρον της επιστημονικής κοινότητας της τεχνητής νοημοσύνης μετατοπίστηκε από τη συλλογή «Μεγάλων Δεδομένων» (Big Data, δηλαδή όσο το δυνατόν μεγαλύτερης ποσότητας στοιχείων) προς τη συλλογή ουσιαστικών δεδομένων και πληροφοριών σχετικών με ένα συγκεκριμένο πρόβλημα. Στοιχείων που μπορούν να χρησιμοποιηθούν για την αντιμετώπιση ζητημάτων όπως οι ριζωμένες ανθρώπινες προκαταλήψεις σε ό,τι αφορά την υγειονομική περίθαλψη, η αξιολόγηση μιας φωτογραφικής απεικόνισης ή ακόμα και η επεξεργασία και κατανόηση μιας διαλέκτου.

Ειδικά στα συστήματα υγείας μέχρι σήμερα έχει αποδειχθεί ότι πολλοί αλγόριθμοι διευρύνουν τις υπάρχουσες ανισότητες αναφορικά με την περίθαλψη. Για παράδειγμα, ο Ομπερμάγερ διαπίστωσε ότι ένα σύστημα τεχνητής νοημοσύνης που χρησιμοποιείται από νοσοκομεία που νοσηλεύουν περί τα 70 εκατομμύρια Αμερικανούς με χρόνιες παθήσεις, έδινε προτεραιότητα στους λευκούς ασθενείς έναντι των πιο μαύρων, ακόμα κι αν οι δεύτεροι ήταν πιο σοβαρά άρρωστοι και χρειάζονταν επειγόντως βοήθεια. Αυτό συνέβαινε επειδή οι αλγόριθμοι εκτιμούσαν και αξιολογούσαν τον κίνδυνο με βάση δεδομένα που περιλάμβαναν το συνολικό κόστος της υγειονομικής περίθαλψης ενός ατόμου σε ένα έτος. Το υπολογιστικό μοντέλο εκτιμούσε το κόστος της θεραπείας για να προσδιορίσει τις ανάγκες περίθαλψης και να αξιολογήσει τη σοβαρότητα του περιστατικού.

Η ουσία αυτού του προβλήματος, που αντανακλά στα υποκείμενα δεδομένα του μοντέλου, είναι ότι δεν συνεισφέρουν όλοι και με τον ίδιο τρόπο στο κόστος της περίθαλψης. Οι μειονότητες και άλλοι υποεξυπηρετούμενοι κοινωνικά πληθυσμοί ενδέχεται να μην έχουν πρόσβαση και πόρους για υγειονομική περίθαλψη. Ενδέχεται να μην μπορούν να πάρουν άδεια από την εργασία τους για να επισκεφθούν τον γιατρό, ενώ μπορεί να βιώσουν διακρίσεις και εντός του συστήματος υγείας, λαμβάνοντας λιγότερες θεραπείες ή κάνοντας πλημμελείς εξετάσεις, γεγονός που μπορεί να οδηγήσει στην ταξινόμησή τους ως «λιγότερο δαπανηρών» όταν ενταχθούν σε σύνολα δεδομένων. Αυτό όμως δεν σημαίνει ότι ήταν λιγότερο άρρωστοι από τους πιο «δαπανηρούς».

Οι ερευνητές υπολόγισαν ότι σε ποσοστό σχεδόν 47% οι μαύροι ασθενείς χρειάζονταν επιπλέον ιατροφαρμακευτική φροντίδα. Και αποδείχθηκε ότι, βάσει του αλγορίθμου, μόνο το 17% είχε εν τέλει την επιπλέον φροντίδα.

«Οι μαύροι θα κοστίσετε λιγότερο στο Σύστημα Υγείας, παρόλο που οι ανάγκες σας είναι οι ίδιες με εκείνες των λευκών. Αυτή ήταν η κεντρική ιδέα της προκατάληψης που εντοπίσαμε», είπε ο Obermeyer. Ο Αμερικανός επιστήμονας διαπίστωσε ότι πολλά άλλα παρόμοια συστήματα τεχνητής νοημοσύνης χρησιμοποιούσαν το κόστος ως πρόφαση για διακρίσεις. Κάτι που, όπως εκτιμά, επηρεάζει τις ζωές περίπου 200 εκατομμυρίων ασθενών στις ΗΠΑ.

Σε αντίθεση με τα ευρέως χρησιμοποιούμενα σύνολα δεδομένων, όπως το ImageNet, τα οποία σχεδιάστηκαν με βάση φωτογραφίες από το Διαδίκτυο και δεν αντικατοπτρίζουν απαραίτητα την ποικιλομορφία του πραγματικού κόσμου, μια σειρά από νέα σύνολα δεδομένων περιλαμβάνουν πληροφορίες που είναι πιο αντιπροσωπευτικές του πληθυσμού. Αυτά δεν εξασφαλίζουν μόνο την ευρύτερη εφαρμογή και τη μεγαλύτερη ακρίβεια των αλγορίθμων, αλλά επεκτείνουν ταυτόχρονα και την επιστημονική μας γνώση.

Αυτά τα νέα, διαφορετικά και υψηλής ποιότητας σύνολα δεδομένων θα μπορούσαν να χρησιμοποιηθούν για την εξάλειψη των υφιστάμενων προκαταλήψεων «που εισάγουν διακρίσεις με αποτέλεσμα πολλοί άνθρωποι, συνήθως γυναίκες και μέλη μειονοτήτων, να εξυπηρετούνται πλημμελώς, διότι δεν εκπροσωπούνται στα συστήματα υγειονομικής περίθαλψης», δήλωσε ο πρώην μάνατζερ του Google Έρικ Σμιντ, το Ίδρυμα του οποίου χρηματοδοτεί το Nightingale Open Science. «Μπορείτε να χρησιμοποιήσετε την τεχνητή νοημοσύνη για να κατανοήσετε τι πραγματικά συμβαίνει με τον άνθρωπο, αντί να τη χρησιμοποιήσετε για να μάθετε το τι πρεσβεύει ο κάθε γιατρός», τόνισε.

Τα σύνολα δεδομένων Nightingale περιλαμβάνονται μεταξύ των δεκάδων «πρότζεκτ» που παρουσιάστηκαν στην εφετινή συνδιάσκεψη για την τεχνητή νοημοσύνη (NeurIPS). Μεταξύ άλλων παρουσιάστηκε ένα σύνολο δεδομένων ομιλίας με μανδαρινικά και οκτώ υποδιαλέκτους που καταγράφτηκαν από 27.000 άτομα σε 34 πόλεις της Κίνας. Επίσης παρουσιάστηκε το μεγαλύτερο σύνολο δεδομένων αναπνευστικών ήχων ασθενών με Covid, όπως η αναπνοή, ο βήχας και ηχογραφήσεις της φωνής τους – πρόκειται για ένα πρόγραμμα στο οποίο συμμετείχαν περισσότεροι από 36.000 ασθενείς που προσφέρθηκαν να βοηθήσουν για την αντιμετώπιση της πανδημίας.

Παρουσιάστηκε, τέλος, ένα σύνολο δεδομένων δορυφορικών εικόνων που καλύπτουν ολόκληρη την επικράτεια της Νότιας Αφρικής από το 2006 έως το 2017. Πρόκειται για εικόνες χωρισμένες και επισημασμένες ανά γειτονιά, για τη μελέτη των κοινωνικών επιπτώσεων του χωροταξικού απαρτχάιντ που παρατηρείται τα τελευταία χρόνια στη χώρα.

Η Ελέιν Νσοεζί, υπολογιστική επιδημιολόγος στη Σχολή Δημόσιας Υγείας του Πανεπιστημίου της Βοστώνης, είπε ότι νέοι τύποι δεδομένων θα μπορούσαν επίσης να βοηθήσουν στη μελέτη της εξάπλωσης ασθενειών σε διάφορες γεωγραφικές περιοχές του πλανήτη, καθώς άνθρωποι από διαφορετικούς πολιτισμούς αντιδρούν διαφορετικά στις διάφορες ασθένειες.

Η δόκτωρ Νσοεζί είπε ότι η γιαγιά της στο Καμερούν, για παράδειγμα, ίσως σκέπτεται διαφορετικά και αντιμετωπίζει διαφορετικά από τους Αμερικανούς τα θέματα υγείας. «Αν κάποιος αρρώσταινε με γρίππη στο Καμερούν, θα αντιμετώπιζαν την ασθένειά του πιθανότατα με παραδοσιακές θεραπείες βοτάνων ή με γιατροσόφια στο σπίτι, παρά με φάρμακα και άλλες θεραπείες που θα χρησιμοποιούσαν στις ΗΠΑ», επισήμανε.

Οι ειδικοί στους υπολογιστές Σερένα Γιούνγκ και Γιόακιμ Βανσχέρεν, οι οποίοι θεώρησαν ότι το NeurIPS πρέπει να εξελιχθεί σε κομβική εκδήλωση ανταλλαγής απόψεων και σε «εργαστήρι» για τη δημιουργία νέων συνόλων δεδομένων, επισήμαναν ότι η συντριπτική πλειονότητα της επιστημονικής κοινότητας της τεχνητής νοημοσύνης εξακολουθεί να μην μπορεί να βρει αξιόπιστα σύνολα δεδομένων για να αξιολογήσει την χρησιμότητα των αλγορίθμων της. Αυτό σημαίνει ότι οι ερευνητές της τεχνητής νοημοσύνης εξακολουθούν να στρέφονται σε δεδομένα που δυνητικά «μαστίζονται από τις προκαταλήψεις», όπως είπαν χαρακτηριστικά. «Δεν μπορείς να φτιάξεις καλά μοντέλα, αν δεν διαθέτεις καλά δεδομένα», αποφάνθηκαν οι δύο επιστήμονες.

Πρόσφατα Άρθρα