ΠΟΙΚΙΛΗΣ ΥΛΗΣ - ΕΠΙΣΤΗΜΗ

ΑΝΑΦΟΡΑ ΤΟΥ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΣΤΑΝΦΟΡΝΤ

Ραγδαία εξέλιξη στον τομέα της Τεχνητής Νοημοσύνης

Πολύ κοντινές ή ακόμη και ανώτερες επιδόσεις συγκριτικά με τον άνθρωπο σε τεστ κατανόησης κειμένου, διαγωνιστικών μαθηματικών και άλλα

Χαρακτηριστική η τεράστια βελτίωση μέσα σε δύο χρόνια στην ποιότητα εικόνων του Χάρι Πότερ τις οποίες παρήγαγε το πρόγραμμα ΤΝ Midjourney

Διάφορα συστήματα Τεχνητής Νοημοσύνης (ΤΝ), όπως το διαλογικό ρομπότ ChatGPT, αλλά όχι μόνο αυτό, έχουν προχωρήσει τόσο ώστε να πετυχαίνουν σχεδόν την ίδια απόδοση ή και να ξεπερνούν τον άνθρωπο σε τεστ αξιολόγησης της κατανόησης κειμένου, της ταξινόμησης εικόνων και των διαγωνιστικών μαθηματικών. Αυτό είναι ένα από τα συμπεράσματα της φετινής αναφοράς για την εξέλιξη της ΤΝ, την οποία συντάσσει κάθε χρόνο από το 2017 μέχρι σήμερα το Ινστιτούτο Ανθρωποκεντρικής Τεχνητής Νοημοσύνης του Πανεπιστημίου Στάνφορντ των ΗΠΑ.

Στη μεγέθους 500 σελίδων αναφορά, που παρουσιάζει τη μετεωρική πρόοδο των συστημάτων μηχανικής μάθησης την τελευταία δεκαετία, επισημαίνεται ότι είναι τόσο ραγδαία η εξέλιξη της ΤΝ που πολλά σημεία αναφοράς και τεστ ελέγχου επιδόσεων γίνονται σύντομα πεπαλαιωμένα και πρέπει να εφευρίσκονται καινούρια. Ιδιαίτερη ανάγκη υπάρχει στον τομέα αξιολόγησης της ικανότητας αφαίρεσης και συλλογισμού. Γι' αυτό τα νέα τεστ αξιολόγησης συχνά δεν είναι απολύτως αυτοματοποιημένα, αλλά περιλαμβάνουν και εκτίμηση από άνθρωπο.

Ενα από τα πιο πρόσφατα νέα τεστ είναι το GPQA της «Google», που περιλαμβάνει πάνω από 400 ερωτήσεις πολλαπλής επιλογής, τόσο δύσκολες που ακαδημαϊκοί με διδακτορικό μπορούν να απαντήσουν σωστά μόνο το 65% εκείνων που αφορούν τον επιστημονικό τομέα τους και μόνο το 34% των ερωτήσεων εκτός του τομέα τους, παρότι έχουν πρόσβαση στο διαδίκτυο κατά τη διάρκεια του τεστ. Η τυχαία απάντηση στις ερωτήσεις θα εξασφάλιζε ένα ποσοστό σωστών απαντήσεων γύρω στο 25%. Μέχρι το 2022 τα συστήματα ΤΝ πετύχαιναν ποσοστό 30% - 40%. Πέρσι το Claude 3 της «Anthropic» πέτυχε 60%, σοκάροντας πολλούς επιστήμονες.

Σοκ

Τα σημερινά συστήματα ΤΝ σαφώς και δεν έχουν αντίληψη του κόσμου, είναι ικανά μόνο σε κάποιον τομέα - αν και το 2023 σηματοδότησε την άνοδο της πολυτροπικής ΤΝ, που μπορεί να διαχειρίζεται όχι μόνο τον λόγο ή μόνο τις εικόνες (στατικές και κινούμενες, δηλαδή βίντεο) ή μόνο τις ηχητικές καταγραφές, αλλά συνδυαστικά όλα αυτά τα μέσα. Ενα τέτοιο σύστημα, το MMLU, πετυχαίνει ακρίβεια 90,04%, όταν η γραμμή βάσης των απαντήσεων ανθρώπων βρίσκεται στο 89,8%.

Παρά τα εντυπωσιακά αποτελέσματα, ένα Μεγάλο Γλωσσικό Μοντέλο (ΜΓΜ), όπως το GPT, στο οποίο στηρίζεται το ChatGPT, δεν καταλαβαίνει πραγματικά τι γράφει: Απλώς βρίσκει την πιθανότερη λέξη που θα πρέπει να ακολουθήσει, με βάση την εκπαίδευση που έχει υποβληθεί, αξιοποιώντας το μεγαλύτερο μέρος του γραπτού λόγου που είναι καταχωρημένος σε ηλεκτρονική μορφή σήμερα. Κατά τον ίδιο τρόπο αναλύει το κείμενο που διαβάζει, π.χ. μια εντολή του χρήστη ή ένα μεγαλύτερο κείμενο, ώστε να απαντήσει με την κατάλληλη αλληλουχία λέξεων, χωρίς να αντιστοιχεί αυτές τις λέξεις σε έννοιες, όπως στο μυαλό του ανθρώπου. Αλλες μορφές ΤΝ προσπαθούν να δημιουργήσουν ένα τέτοιο εννοιολογικό πλαίσιο, ενώ έχει προχωρήσει πολύ και η ΤΝ της Επεξεργασίας Φυσικής Γλώσσας (NLP), που μεταξύ άλλων αναλύει γραμματικά και συντακτικά κείμενα ανθρώπινης γλώσσας. Η χρήση των ΜΓΜ στη ρομποτική έχει οδηγήσει σε αποδοτικότερα βιομηχανικά ρομπότ, καθώς πέρα από τις συνήθεις λειτουργίες τους μπορούν τώρα να ρωτούν σε φυσική γλώσσα και να καταλαβαίνουν τις απαντήσεις των χειριστών τους, επιταχύνοντας έτσι τη λειτουργία τους.

Εκτόξευση

Μεγάλη άνοδο παρουσιάζει η χρήση της ΤΝ στην επιστημονική έρευνα, και γι' αυτό η αναφορά του Στάνφορντ περιέχει για πρώτη φορά ένα ξεχωριστό κεφάλαιο για τις σχετικές εφαρμογές, επισημαίνοντας προγράμματα όπως τα Δίκτυα Γράφων για την Εξερεύνηση Υλικών (GNoME), ένα σύστημα της θυγατρικής της «Google», «DeepMind», το οποίο αποσκοπεί να βοηθήσει τους χημικούς στην ανακάλυψη νέων υλικών, και το GraphCast, ένα άλλο εργαλείο της «DeepMind», το οποίο πετυχαίνει ταχύτατη πρόγνωση καιρού.

Ενδειξη της ραγδαίας ανόδου της ΤΝ που βασίζεται στα νευρωνικά δίκτυα και στους αλγόριθμους μηχανικής μάθησης είναι ο αριθμός των σχετικών έργων στην πλατφόρμα διαμοιρασμού κώδικα GitHub, που ενώ το 2011 ήταν μόλις 800, το 2023 έφτασαν τα 1,8 εκατομμύρια! Οι επιστημονικές δημοσιεύσεις για θέματα ΤΝ τριπλασιάστηκαν την ίδια περίοδο. Οι πατέντες ΤΝ αυξήθηκαν κατά 62,7% από το 2021 έως το 2022, ενώ το 2022 συγκριτικά με το 2010 ήταν 31 φορές περισσότερες! Στις πατέντες η Κίνα κατοχύρωσε το 2022 το 61,1% απ' αυτές, ενώ οι ΗΠΑ μόλις το 20,9%, όταν το 2011 είχαν μερίδιο 54,1%. Πρώτη στον κόσμο είναι η Κίνα και στον αριθμό των βιομηχανικών ρομπότ. Ωστόσο, πολύ πιο μπροστά βρίσκονται οι ΗΠΑ συγκριτικά με τον υπόλοιπο κόσμο όσον αφορά τα αξιόλογα νέα μοντέλα μηχανικής μάθησης που εμφανίστηκαν το 2023, καθώς αμερικανικοί οργανισμοί παρουσίασαν 61 μοντέλα, οργανισμοί της ΕΕ 21, της Κίνας 15, του Καναδά, του Ισραήλ και της Βρετανίας από 4, της Σιγκαπούρης και των Ηνωμένων Αραβικών Εμιράτων από 3 και της Αιγύπτου 2.

Το «πάπλωμα»

Η αρχική ανάπτυξη της ΤΝ και η παραπέρα εξέλιξή της μέχρι το 2016 πραγματοποιήθηκαν μέσα σε ακαδημαϊκά ιδρύματα, στηριγμένες πάνω στη συσσωρευμένη επιστημονική γνώση και σε δημόσιο χρήμα. Σύμφωνα με την έκθεση του Στάνφορντ, την τελευταία επταετία, που η ΤΝ βρίσκεται σε επίπεδο επαρκές για τη μαζική αξιοποίησή της στην παραγωγή, η σχετική έρευνα έχει μετατοπιστεί στη βιομηχανία. Προς τη βιομηχανία έχουν μεταπηδήσει και πολλά μυαλά από τον ακαδημαϊκό χώρο. Οι όμιλοι αναπτύσσουν πια το μεγαλύτερο ποσοστό των πιο αξιόλογων νέων συστημάτων μηχανικής μάθησης, συχνά κρατώντας μυστικές τις μεθόδους, τα δεδομένα και τον κώδικα που χρησιμοποίησαν (όπως η «OpenAI» με το ChatGPT), ενώ αξιοποιούν και πάλι το δημόσιο χρήμα, καθώς ακαδημαϊκοί ερευνητές ασχολούνται κυρίως με την ανάλυση και την αναζήτηση αδυναμιών των νέων συστημάτων, ώστε αυτά να βελτιωθούν. Τα καλύτερα από τα «κλειστά» συστήματα παρουσιάζουν τριπλάσιες επιδόσεις συγκριτικά με τα καλύτερα «ανοιχτά» συστήματα ΤΝ και κάθε μονοπώλιο που αναπτύσσει ένα τέτοιο σύστημα το αξιοποιεί προς το συμφέρον του, μέχρι οι ανταγωνιστές να φτάσουν στο ίδιο επίπεδο. Η χρηματοδότηση από τον ιδιωτικό τομέα στην παραγωγική ΤΝ (κυρίως Μεγάλα Γλωσσικά Μοντέλα) εκτινάχθηκε στα 25,23 δισ. δολάρια το 2023, από περίπου 3 δισ. το 2022.

Η ΤΝ αυξάνει την παραγωγικότητα επιτρέποντας στους εργαζόμενους να ολοκληρώσουν τις εργασίες πιο γρήγορα, ενώ αυξάνει και την ποιότητα των προϊόντων. Το 42% των επιχειρήσεων που ρωτήθηκαν ανέφεραν περιορισμούς στο κόστος παραγωγής από την εφαρμογή της ΤΝ και το 59% ανέφερε αυξήσεις εσόδων. Στον καπιταλισμό, όμως, αυτά γίνονται σε βάρος των εργαζομένων, που ορισμένοι απολύονται ενώ άλλων η δουλειά εντατικοποιείται. Παραδόξως, τα πλήγματα αφορούν ακόμα και τους εργαζόμενους στην ανάπτυξη ΤΝ, καθώς από το 2022 και μετά υπάρχει απότομη πτώση στις προσφερόμενες θέσεις εργασίας σ' αυτόν τον τομέα σχεδόν σε όλο τον κόσμο.

Ανησυχία

Μαζί με την άνοδο της απόδοσης της ΤΝ ανεβαίνει και το κόστος δημιουργίας αλλά και λειτουργίας των νέων μοντέλων, καθώς τα αποδοτικότερα συστήματα απαιτούν εκπαίδευση με ακόμα μεγαλύτερη ποσότητα δεδομένων. Η εκπαίδευση του ΜΓΜ ChatGPT-4 της «OpenAI» στοίχισε 78 εκατ. δολάρια, ενώ του Gemini Ultra της «Google» 191 εκατομμύρια. Για τη λειτουργία τους χρειάζονται μεγάλες ποσότητες ηλεκτρικού ρεύματος, αλλά και νερού για την ψύξη των υπολογιστών. Ορισμένοι ερευνητές ανησυχούν ότι σύντομα δεν θα υπάρχουν άλλα διαθέσιμα δεδομένα για την εκπαίδευση των ΜΓΜ, αν και ήδη χρησιμοποιείται η ΤΝ για την παραγωγή περισσότερων εξειδικευμένων δεδομένων, όπως τα νέα μοντέλα SegmentAnything και Skoltech για παραγωγή δεδομένων χρήσιμων στον κατακερματισμό εικόνων και στις τρισδιάστατες ανακατασκευές.

Αυξημένη είναι σύμφωνα με την έκθεση του Στάνφορντ η ανησυχία των ανθρώπων για τις επιπτώσεις της εξάπλωσης της ΤΝ στις παρούσες συνθήκες (καπιταλισμού). Στο 66% από 60% ανέβηκε το 2023, συγκριτικά με το 2022, το ποσοστό των ανθρώπων που εκτιμούν ότι η ΤΝ θα επηρεάσει δραματικά τη ζωή τους μέσα στα επόμενα 3 έως 5 χρόνια. Το 52% εκφράζει νευρικότητα ως προς τα προϊόντα και τις υπηρεσίες ΤΝ, αύξηση κατά 13% συγκριτικά με το 2022. Στις ΗΠΑ το 52% νιώθει πιο ανήσυχο παρά ενθουσιασμένο με την ΤΝ, συγκριτικά με το 38% το 2022. Μόνο 37% θεωρεί ότι η ΤΝ θα βελτιώσει τη δουλειά του, 34% ότι θα ωθήσει την οικονομία και 32% ότι θα βελτιώσει την αγορά εργασίας. Οσο υπάρχουν οι καπιταλιστικές σχέσεις παραγωγής και η αξιοποίηση της ΤΝ διευρύνεται στο πλαίσιό τους, οι ανησυχίες αυτές είναι απολύτως δικαιολογημένες.

Επιμέλεια:
Σταύρος ΞΕΝΙΚΟΥΔΑΚΗΣ
Πηγές: http://aiindex.stanford.edu, «Scientific American»