Ορόσημο στην ανάπτυξη της Τεχνητής Νοημοσύνης | ΠΟΙΚΙΛΗΣ ΥΛΗΣ - ΕΠΙΣΤΗΜΗ

ΠΟΙΚΙΛΗΣ ΥΛΗΣ - ΕΠΙΣΤΗΜΗ

ΔΙΑΛΟΓΙΚΟ ΓΛΩΣΣΙΚΟ ΜΟΝΤΕΛΟ CHATGPT

Ορόσημο στην ανάπτυξη της Τεχνητής Νοημοσύνης

Στο σημερινό Α' μέρος: Τι είναι, πώς κατασκευάστηκε και τι μπορεί να κάνει αυτό το είδος Τεχνητής Νοημοσύνης

Η έρευνα γύρω από την Τεχνητή Νοημοσύνη (ΤΝ) παρουσιάζει ραγδαία πρόοδο τα τελευταία χρόνια, βασισμένη στην αυξημένη υπολογιστική ισχύ, λόγω της τεχνολογικής ανάπτυξης στον τομέα των ημιαγωγών, της αυξημένης συγκέντρωσης δεδομένων εύκολα προσβάσιμων, μέσω του διαδικτύου και της βελτίωσης των μοντέλων ΤΝ, ενσωματώνοντας νέες τεχνικές και μεθόδους. Δεν λείπουν ούτε και σήμερα αυτοί που επικεντρώνουν στις αδυναμίες της ΤΝ απέναντι στην ανθρώπινη νοημοσύνη, τονίζοντας ότι ακόμη απέχει πολύ από το να την πλησιάσει, ή επικεντρώνουν στην (επίσης προφανή και αναμενόμενη με δεδομένη τη μη βιολογική της βάση) διαφορετικότητα της ΤΝ από την ανθρώπινη νοημοσύνη. Ωστόσο, δύσκολα μπορεί να αγνοήσει κανείς την επίδραση που έχουν ήδη οι εφαρμογές ΤΝ στην παραγωγή και την καθημερινότητα και την επίδραση που θα έχουν αυτές που διαφαίνονται καθαρά πια στον ορίζοντα. Μέσα στους τρεις μήνες από την εμφάνισή του στο ευρύ κοινό την τελευταία μέρα του περασμένου Νοέμβρη, ένα νέο μοντέλο ΤΝ δείχνει ότι θα αποτελέσει ορόσημο, καθώς για πρώτη φορά εμφανίζεται μια μηχανή που μπορεί να αναλάβει με αξιώσεις μέρος της λεγόμενης πνευματικής εργασίας του ανθρώπου.

Πρόκειται για το ChatGPT, ένα γλωσσικό μοντέλο ΤΝ φτιαγμένο έτσι ώστε να αλληλεπιδρά με τον άνθρωπο με μορφή διαλόγου. Κατά την κατασκευάστρια «OpenAI» η διαλογική μορφή επικοινωνίας τού επιτρέπει να απαντά σε επακόλουθες ερωτήσεις, να παραδέχεται τα λάθη του, να αμφισβητεί λαθεμένα δεδομένα και να απορρίπτει ακατάλληλα αιτήματα.

Η «OpenAI» εμφανίζεται ως μη κερδοσκοπικός οργανισμός, που ελέγχει την «OpenAI LP», μια υβριδική εταιρεία «περιορισμένου κέρδους», όπως αυτοχαρακτηρίζεται. Κύριος χρηματοδότης της «OpenAI» είναι η «Microsoft», μονοπώλιο του χώρου της Πληροφορικής, που επιδιώκει να χρησιμοποιήσει το ChatGPT για να νικήσει έναν από τους μεγάλους ανταγωνιστές του στον βασικό τομέα δραστηριότητάς του (περισσότερα γι΄ αυτό στο Β' μέρος του δημοσιεύματος). Το ChatGPT λειτουργεί στο υπολογιστικό νέφος (cloud), πάνω σε υποδομή κέντρων δεδομένων (data centers) της «Microsoft». Λόγω των τεράστιων υπολογιστικών πόρων και των πόρων αποθήκευσης δεδομένων, που απαιτεί για τη λειτουργία του, δεν φαίνεται ότι θα είναι τουλάχιστον στο προσεχές μέλλον εφικτή η αυτόνομη λειτουργία έστω και μιας απλούστερης εκδοχής του σε μεμονωμένες και μη συνδεδεμένες με το διαδίκτυο υπολογιστικές συσκευές, όσο ισχυρές κι αν είναι αυτές.

Εποπτεία, ανατροφοδότηση, ανταμοιβή, βελτιστοποίηση

Το ChatGPT χρησιμοποιεί την τεχνική της Ενισχυτικής Μάθησης από Ανθρώπινη Ανατροφοδότηση (Reinforcement Learning from Human Feedback ή RLHF), είναι μετεξέλιξη του μοντέλου GPT-3.5 και βασίζεται στο InstructGPT. Στην αρχική του εκδοχή το ChatGPT εκπαιδεύτηκε με εποπτευόμενη (από άνθρωπο) ρύθμιση, με τους εκπαιδευτές να του παρέχουν συζητήσεις στις οποίες έπαιζαν διπλό ρόλο, τόσο του ερωτώντα, όσο και του βοηθού της ΤΝ. Στους εκπαιδευτές δόθηκαν επιλογές απαντήσεων, που γράφτηκαν από το μοντέλο, ώστε να τους βοηθήσουν στις απαντήσεις τους. Αυτό το νέο σύνολο διαλόγων αναμείχθηκε με το σετ διαλόγων που είχε χρησιμοποιηθεί στο InstructGPT.

Για να δημιουργήσουν ένα μοντέλο ανταμοιβής για την ενισχυτική μάθηση (όταν η ΤΝ παράγει αποδεκτή απάντηση «ανταμείβεται», με αποτέλεσμα να ενισχύονται οι σχετικές συνδέσεις που παρήγαγαν την απάντηση μέσα στο νευρωνικό της δίκτυο^*), οι άνθρωποι της «OpenAI» συγκρότησαν συγκριτικά δεδομένα, που αποτελούνταν από δύο ή περισσότερες απαντήσεις, βαθμολογημένες ανάλογα με την ποιότητά τους. Για τη συλλογή αυτών των δεδομένων, χρησιμοποίησαν συζητήσεις που είχαν οι εκπαιδευτές με το ChatGPT. Επέλεξαν τυχαία μια απάντηση του μοντέλου, δοκίμασαν αρκετές διαφορετικές παραλλαγές και οι εκπαιδευτές τις αξιολόγησαν. Χρησιμοποιώντας τα μοντέλα ανταμοιβής και κάνοντας πολλαπλές διορθωτικές επαναλήψεις, ρύθμισαν τις λεπτομέρειες του μοντέλου χρησιμοποιώντας Βελτιστοποίηση Εγγύς Πολιτικής (Proximal Policy Optimization ή PPO). Κατά την «OpenAI» η PPO υπερέχει των καλύτερων μέχρι χτες ανάλογων τεχνικών ενισχυτικής μάθησης, λόγω της ευκολίας στη χρήση της και της καλής της απόδοσης.

Περιορισμοί

Οπως παραδέχεται η «OpenAI», το ChatGPT έχει ορισμένους περιορισμούς. Μερικές φορές γράφει φαινομενικά βάσιμες, αλλά λαθεμένες και τελικά χωρίς νόημα απαντήσεις. Είναι ευαίσθητο σε μικροαλλαγές στις διατυπώσεις των ερωτημάτων ή εντολών και την επανάληψή τους πολλές φορές. Ετσι, μπορεί να δηλώσει ότι δεν γνωρίζει την απάντηση, αλλά με μια μικρή τροποποίηση στο ερώτημα να δώσει τη σωστή απάντηση. Πολλές φορές χρησιμοποιεί περισσότερα λόγια απ' όσα χρειάζονται και κάνει πολύ συχνή χρήση ορισμένων φράσεων, όπως ότι είναι γλωσσικό μοντέλο που εκπαιδεύτηκε από την «OpenAI». Ενώ θα έπρεπε να ρωτάει διευκρινιστικές ερωτήσεις όταν υπάρχει κάποια ασάφεια στη διατύπωση της ερώτησης ή εντολής, συνήθως επιλέγει να μαντέψει τι εννοεί ο άνθρωπος χρήστης.

Μια από τις αδυναμίες που οι ερευνητές δεν μπόρεσαν να αντιμετωπίσουν μέσα από το ίδιο το μοντέλο είναι ότι ορισμένες φορές δεν αρνείται να αποκριθεί σε επιβλαβείς οδηγίες (επιβλαβείς κατά τη γνώμη των εκπαιδευτών) ή να επιδείξει προκατειλημμένη συμπεριφορά. Γι΄ αυτό η «OpenAI» έχει βάλει εξωτερικά φίλτρα συμβατικού λογισμικού στην είσοδο του ChatGPT, ώστε να εμποδίζει ορισμένους τύπους «μη ασφαλούς» περιεχομένου. Παρ' όλ' αυτά, ακόμη κι έτσι το ChatGPT δίνει κάποιες απαντήσεις που δεν είναι αποδεκτές από τους κατασκευαστές του.

«Δωρεάν»

Το ChatGPT είναι η τρέχουσα εκδοχή στην «επαναληπτική ανάπτυξη όλο και πιο ασφαλών και χρήσιμων συστημάτων ΤΝ», όπως δηλώνει η OpenAI. Γι΄ αυτό η εταιρεία αξιοποιεί την αλληλεπίδραση των ήδη πάνω από εκατό εκατομμυρίων χρηστών του ChatGPT, ώστε να βελτιώσει το μοντέλο για να πετύχει «ουσιαστικές μειώσεις στα βλαβερά και αναληθή αποτελέσματα από τη χρήση της RLHF». Κάθε δωρεάν χρήση του ChatGPT αποτελεί ταυτόχρονα και δωρεάν εκπαίδευσή του από τον χρήστη. Προς το παρόν η χρήση του ChatGPT είναι ελεύθερη, αλλά η προοπτική σύμφωνα με την κατασκευάστρια είναι ότι κάποια στιγμή θα μετατραπεί σε συνδρομητικό επί πληρωμή. Ηδη ανακοίνωσε το ChatGPT Plus, μια βελτιωμένη συνδρομητική εκδοχή, με 20 δολάρια το μήνα, που σε αντίθεση με τη δωρεάν εκδοχή είναι πάντα διαθέσιμη και δίνει πιο γρήγορα απαντήσεις. Η OpenAI δίνει προς το παρόν ελεύθερα αρκετές πληροφορίες για την έρευνά της, αλλά δηλώνει ότι όσο προχωρά (τελειοποιώντας τις ΤΝ που αναπτύσσει) θα περιορίζει τη διασπορά των σχετικών πληροφοριών (για να «πατεντάρει» το κρίσιμο κομμάτι της τεχνολογίας). Στα άμεσα σχέδια της εταιρείας είναι η διάθεση του ChatGPT API, δηλαδή μιας διασύνδεσης προγραμματισμού εφαρμογών, που θα επιτρέπει με επιχειρησιακές συνδρομές τη χρήση του γλωσσικού μοντέλου από οποιοδήποτε λογισμικό, ενσωματωμένο σε κάποια συσκευή που μπορεί να συνδεθεί στο διαδίκτυο.

Πολυεργαλείο

Το γλωσσικό μοντέλο ChatGPT δεν διαθέτει μοντέλο του κόσμου και δεν έχει αντίληψη των εννοιών τις οποίες παραθέτει κάνοντας, είναι αλήθεια, πολύ καλή χρήση του λόγου, ούτε της ουσίας των σχέσεων των εννοιών μεταξύ τους. Απλουστευτικά μπορεί να πει κανείς ότι έχει αποτυπωμένο στο νευρωνικό του δίκτυο πως μετά την Α λέξη συνήθως πηγαίνει η Β. Γι' αυτό και μερικές φορές μπορεί να δώσει απίθανες ή αστείες απαντήσεις. Αν είχε εκπαιδευτεί ότι η λέξη σκύλος σημαίνει ένα ζώο με φτερά, ο σκύλος για το ChatGPT θα είχε φτερά.

Παρά τις αδυναμίες του ChatGPT, δύσκολα θα βρεθεί κάποιος που να μην εντυπωσιάστηκε από την αλληλεπίδραση που είχε με αυτή την ΤΝ. Μπορεί να απαντήσει σε ερωτήσεις πληροφοριακού περιεχομένου, να συντάξει κείμενα κατά παραγγελία για ένα θέμα, όπως εκθέσεις, αναφορές, δοκίμια, παραμύθια (!), να συντάξει περιλήψεις κειμένων, να κάνει αυτόματη μετάφραση, σύνταξη ειδήσεων. Τα κείμενα που παράγει μπορεί να τα γράψει μάλιστα στο στιλ γραφής κάποιου γνωστού συγγραφέα ή δημόσιου προσώπου, ή στο στιλ μιας εποχής, εφόσον του ζητηθεί. Μπορεί να γράψει ακόμη και ακαδημαϊκές εργασίες για φοιτητές, γεγονός που προκάλεσε μεγάλη ανησυχία στη διεθνή ακαδημαϊκή κοινότητα. Ο δείκτης ενδεχόμενης λογοκλοπής στα κείμενα που παράγει το ChatGPT είναι πολύ χαμηλός (δεν χρησιμοποιεί αυτούσια τα κείμενα με τα οποία εκπαιδεύτηκε), με αποτέλεσμα να μην μπορεί να εντοπιστεί η λαθροχειρία της χρήσης του ChatGPT με τα διαθέσιμα στους ακαδημαϊκούς εργαλεία. Γι' αυτό η «OpenAI» έσπευσε να κατασκευάσει λογισμικό που όπως ισχυρίζεται μπορεί να αναγνωρίσει με μεγάλο ποσοστό επιτυχίας ποια κείμενα έχουν γραφτεί από άνθρωπο και ποια από ΤΝ (όχι μόνο από το δικό της ChatGPT, αλλά και από άλλες ΤΝ). Το ChatGPT μπορεί ακόμη και να φτιάξει σχετικά απλά προγράμματα υπολογιστών, με βάση οδηγίες που του δίνονται με γλωσσικές διατυπώσεις των απαιτήσεων (περισσότερα στο Β' μέρος). Το ChatGPT, έστω και αν δεν αρίστευσε, πέρασε πάντως τις τελικές εξετάσεις νομικής σχολής των ΗΠΑ, αφού απάντησε σε όλα τα θέματα, από το Συνταγματικό Δίκαιο έως τη φορολογία και τις αδικοπραξίες!

Από χτες...

Η αξιοποίηση του ChatGPT σε ευρεία κλίμακα δεν είναι κάτι μελλοντικό, ή έστω υπόθεση των επόμενων ετών. Ηδη, κάνοντας χρήση του σχεδόν έτοιμου ChatGPT API, διάφορες εταιρείες ενσωματώνουν τις δυνατότητες αυτού και άλλων λιγότερο γνωστών και αποτελεσματικών γλωσσικών μοντέλων σε μια σειρά από προϊόντα, από συσκευές καθημερινής χρήσης στο σπίτι, έως ειδικά εργαλεία για κάλυψη επαγγελματικών αναγκών σε διάφορους τομείς. Για παράδειγμα, εταιρεία ήδη διαφημίζει προϊόν της, που παράγει περιεχόμενο χωρίς λογοκλοπή, για χρήση σε διαφημίσεις, email, ιστοσελίδες και blog και ένα δεύτερο διαλογικό προϊόν, που υποστηρίζει ότι ξεπερνά τους περιορισμούς του ChatGPT. Οι έξυπνοι εικονικοί βοηθοί (τύπου Alexa, Siri κ.τ.λ.) μάλλον θα είναι από τις πρώτες συσκευές που θα αξιοποιήσουν ΤΝ σαν το ChatGPT για διάλογο με τους κατόχους τους. Ολα αυτά συμβαίνουν με βάση τους νόμους της καπιταλιστικής αγοράς και το κυνήγι του κέρδους, μακριά και ανεξάρτητα από οποιεσδήποτε επιτροπές ηθικής και πλαίσια χρήσης της ΤΝ, είτε της ΕΕ, είτε άλλων κρατών και ενώσεων κρατών. Πριν παρουσιάσουν το ChatGPT, η «OpenAI» και η «Microsoft» δεν ρώτησαν την ΕΕ. Οχι ότι θα άλλαζε τίποτα...

Στο επόμενο σαββατοκυριακάτικο φύλλο του «Ριζοσπάστη» το Β' μέρος της παρουσίασης των εξελίξεων στην ΤΝ, που σηματοδοτεί το ChatGPT, οι άλλες ΤΝ της «OpenAI» και οι ανταγωνιστικές ΤΝ, που αναπτύσσουν η «Google» και άλλες εταιρείες: Τι αξιοπιστίας απαντήσεις δίνει το ChatGPT; Πώς απάντησε σε ερωτήματά μας; Τι σημαίνουν οι νέες δημιουργικές μορφές ΤΝ για τη ζωή και την εργασία στον καπιταλισμό; Τι είναι η Τεχνητή Γενική Νοημοσύνη, γιατί την επιδιώκουν και ποιες οι προεκτάσεις της; Τι θα προσφέρει η ΤΝ στον σοσιαλισμό;

^* Τεχνητά νευρωνικά δίκτυα είναι δίκτυα εμπνευσμένα από τα βιολογικά νευρωνικά δίκτυα, που υλοποιούνται συνήθως σε λογισμικό ή υλισμικό ηλεκτρονικού υπολογιστή. Οι συνδέσεις μεταξύ των τεχνητών νευρώνων έχουν τη μορφή «βαρών». Αυξημένο βάρος μιας σύνδεσης σημαίνει υψηλότερη διεγερτικότητα ανάμεσα στους δύο νευρώνες, ενώ μειωμένο βάρος χαμηλότερη από τη μέση διεγερτικότητα μεταξύ τους.

Επιμέλεια:
Σταύρος ΞΕΝΙΚΟΥΔΑΚΗΣ
Πηγές: http://openai.com, http://blog.google, «Scientific American»