ΠΟΙΚΙΛΗΣ ΥΛΗΣ - ΕΠΙΣΤΗΜΗ

Διακήρυξη της ΚΕ του ΚΚΕ για τη συμπλήρωση 80 χρόνων από το τέλος του Β' Παγκοσμίου Πολέμου και την Αντιφασιστική Νίκη των Λαών

ΕΠΙΚΙΝΔΥΝΑ ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ ΤΩΝ ΜΕΓΑΛΩΝ ΓΛΩΣΣΙΚΩΝ ΜΟΝΤΕΛΩΝ

Επιβλαβής χειραγώγηση και κολακεία

Ενα μοντέλο Τεχνητής Νοημοσύνης (ΤΝ) σας δίνει στοιχεία για να λάβετε μια καλά τεκμηριωμένη απόφαση υγειονομικής περίθαλψης που βελτιώνει την ευημερία σας. Ενα άλλο μοντέλο ΤΝ χρησιμοποιεί τον φόβο για να σας πιέσει να λάβετε μια κακώς τεκμηριωμένη απόφαση που βλάπτει την υγεία σας. Το πρώτο σας εκπαιδεύει και σας βοηθά. Το δεύτερο σας ξεγελάει και σας βλάπτει. Αυτά τα σενάρια υπογραμμίζουν τη διαφορά μεταξύ δύο τύπων πειθούς στις αλληλεπιδράσεις ανθρώπου - ΤΝ. Ωφέλιμη (ορθολογική) πειθώ: Χρήση γεγονότων και αποδεικτικών στοιχείων για να βοηθηθούν οι άνθρωποι να κάνουν επιλογές που ευθυγραμμίζονται με το δικό τους συμφέρον. Επιβλαβής χειραγώγηση: Εκμετάλλευση συναισθηματικών και γνωστικών ευπαθειών για να ξεγελαστούν οι άνθρωποι, ώστε να κάνουν επιβλαβείς επιλογές.

Αυτά σημειώνουν σε μελέτη τους ερευνητές της «DeepMind», θυγατρικής της «Google» («Alphabet»), σε μια προσπάθεια - όπως λένε - να κατανοήσουν καλύτερα τον κίνδυνο ανάπτυξης δυνατοτήτων από την ΤΝ για επιβλαβή χειραγώγηση και να δημιουργήσουν ένα κλιμακωτό πλαίσιο αξιολόγησης για τη μέτρηση αυτού του σύνθετου τομέα. Για να το πετύχουν, προσομοίωσαν κακή χρήση σε περιβάλλοντα υψηλού διακυβεύματος, ωθώντας ρητά την ΤΝ να προσπαθήσει να χειραγωγήσει αρνητικά τις πεποιθήσεις και τις συμπεριφορές των ανθρώπων σε βασικά θέματα.

Η έρευνα περιελάμβανε τη διεξαγωγή 9 μελετών στις οποίες συμμετείχαν πάνω από 10.000 συμμετέχοντες από το Ηνωμένο Βασίλειο, τις ΗΠΑ και την Ινδία. Εστίασαν σε τομείς υψηλού ρίσκου, όπως τα χρηματοοικονομικά, όπου χρησιμοποίησαν προσομοιωμένα επενδυτικά σενάρια για να ελέγξουν αν η ΤΝ μπορούσε να επηρεάσει τον τρόπο που θα συμπεριφέρονταν οι άνθρωποι σε σύνθετα περιβάλλοντα λήψης αποφάσεων και την υγεία, όπου παρακολούθησαν αν η ΤΝ μπορούσε να επηρεάσει ποια συμπληρώματα διατροφής προτιμούσαν οι άνθρωποι. Είναι ενδιαφέρον ότι η ΤΝ ήταν λιγότερο αποτελεσματική στον επιβλαβή χειρισμό των συμμετεχόντων σε θέματα που σχετίζονται με την υγεία. Τα ευρήματά τους δείχνουν ότι η επιτυχία σε έναν τομέα δεν προβλέπει την επιτυχία σε έναν άλλον, ενώ - όπως αναμενόταν - τα μοντέλα ΤΝ αποδείχθηκαν πιο χειριστικά όταν έλαβαν ρητές οδηγίες να είναι τέτοια.

Καθώς οι δυνατότητες των μοντέλων εξελίσσονται, το ίδιο πρέπει να συμβαίνει και με τις τεχνικές αξιολόγησης και μετριασμού από τη μεριά μας, παραδέχεται η «DeepMind» και αναφέρει ότι διερευνά πώς να αξιολογήσει ηθικά την αποτελεσματικότητα της επιβλαβούς χειραγώγησης σε ακόμα πιο σημαντικές καταστάσεις, όπως συζητήσεις που αφορούν βαθιά ριζωμένες προσωπικές πεποιθήσεις, όπου οι χρήστες μπορεί να είναι πιο επιρρεπείς.

«Ψύχωση»

«Η "ψύχωση της Τεχνητής Νοημοσύνης" ή "παραληρηματική σπειροειδής κίνηση" είναι ένα αναδυόμενο φαινόμενο όπου οι χρήστες chatbots Τεχνητής Νοημοσύνης (AI chatbots) νιώθουν επικίνδυνα σίγουροι για εξωφρενικές πεποιθήσεις μετά από εκτεταμένες συνομιλίες με chatbots. Αυτό το φαινόμενο συνήθως αποδίδεται στην καλά τεκμηριωμένη προκατάληψη των chatbots Τεχνητής Νοημοσύνης προς την επικύρωση των ισχυρισμών των χρηστών, μια ιδιότητα που συχνά ονομάζεται "κολακεία" (...) Επιπλέον, αυτό το φαινόμενο επιμένει παρά τις δύο υποψήφιες λύσεις: Την αποτροπή των chatbots από το να έχουν ψευδείς ισχυρισμούς και την ενημέρωση των χρηστών για την πιθανότητα κολακείας του μοντέλου». Αυτό υποστηρίζουν άλλοι ερευνητές σε μελέτη τους που δημοσιεύτηκε στο έγκυρο επιστημονικό περιοδικό «Science».

Τα chatbots των Μεγάλων Γλωσσικών Μοντέλων (LLM) έχουν την τάση να κολακεύουν. Αν ζητήσετε συμβουλές από ένα μοντέλο, είναι κατά μέσο όρο 49% πιο πιθανό από έναν άνθρωπο να επιβεβαιώσει την υπάρχουσα άποψή σας αντί να την αμφισβητήσει, σύμφωνα με τη μελέτη. Οι ερευνητές απέδειξαν ότι η λήψη διαπροσωπικών συμβουλών από ένα chatbot - κόλακα μπορεί να κάνει τους ανθρώπους λιγότερο πιθανό να ζητήσουν συγγνώμη και πιο πεπεισμένους ότι έχουν δίκιο.

Στους ανθρώπους αρέσει αυτό που έχουν να πουν τέτοια chatbots. Οι συμμετέχοντες στη μελέτη προτίμησαν τα μοντέλα Τεχνητής Νοημοσύνης - κόλακες από άλλα μοντέλα, που τους έδωσαν ειλικρινείς απαντήσεις, ακόμα κι όταν οι κόλακες έδωσαν στους συμμετέχοντες κακές συμβουλές. Οι ερευνητές ανέλυσαν πρώτα τη συμπεριφορά 11 κορυφαίων LLM, συμπεριλαμβανομένων κλειστών μοντέλων όπως το GPT-4o της «OpenAI» και το Gemini της «Google», και πιο διαφανών, όπως αυτά που δημιούργησε η κινεζική «DeepSeek».

Κακός σύμβουλος

Η επικεφαλής συγγραφέας της μελέτης, Μίρα Τσενγκ του Πανεπιστημίου Στάνφορντ, και οι συνεργάτες της επιμελήθηκαν σύνολα ερωτήσεων συμβουλών για διαπροσωπικές συγκρούσεις. Τα μοντέλα ΤΝ ενέκριναν έμμεσα ή ρητά στο 51% των περιπτώσεων τις ενέργειες εμπλεκόμενων σε τέτοιες συγκρούσεις που απέρριψαν άνθρωποι κριτές. Επίσης, επιβεβαίωσαν τις αρνητικές ενέργειες εμπλεκόμενων κατά 48% περισσότερο από ό,τι οι άνθρωποι σε ένα άλλο σύνολο ερωτήσεων συμβουλών ανοιχτού τύπου. Και όταν τους παρουσιάστηκε ένα σύνολο «προβληματικών» ενεργειών που ήταν παραπλανητικές, ανήθικες ή ακόμα και παράνομες, τα μοντέλα τις ενέκριναν κατά μέσο όρο σε ποσοστό 47%.

Σε άλλο πείραμα, ένα μέρος των συμμετεχόντων ανθρώπων πήρε απαντήσεις για τη στάση του σε συγκρουσιακές καταστάσεις από μοντέλο - κόλακα και ένα άλλο μέρος από μοντέλο που απαντούσε επικριτικά αλλά ευγενικά. Τα αποτελέσματα ήταν εντυπωσιακά. Τα άτομα που εκτέθηκαν σε Τεχνητή Νοημοσύνη - κόλακα και στα δύο πειράματα ήταν σημαντικά λιγότερο πιθανό να πουν ότι πρέπει να ζητήσουν συγγνώμη ή να αλλάξουν τη συμπεριφορά τους στο μέλλον. Ηταν πιο πιθανό να θεωρούν ότι είχαν δίκιο, και πιο πιθανό να πουν ότι θα ξαναχρησιμοποιούσαν το LLM στο μέλλον. Οι συγγραφείς κατέληξαν στο συμπέρασμα ότι η κολακεία της Τεχνητής Νοημοσύνης είναι «μια ξεχωριστή και προς το παρόν μη ρυθμιζόμενη κατηγορία βλάβης».

Επιμέλεια:
Σταύρος ΞΕΝΙΚΟΥΔΑΚΗΣ
Πηγές: https://deepmind.google, https://arxiv.org, «Scientific American»

Εργασία από Τεχνητή Νοημοσύνη εγκρίθηκε για παρουσίαση σε επιστημονικό συνέδριο

Επιστημονική εργασία που δημιουργήθηκε από Τεχνητή Νοημοσύνη (ΤΝ) κατάφερε να περάσει την αξιολόγηση από επιτροπή ειδικών, από αυτές που ελέγχουν τις μελέτες πριν τη δημοσίευσή τους σε επιστημονικά περιοδικά ή την παρουσίασή τους σε επιστημονικά fora. Η εμφάνιση ερευνητικών εργασιών που δημιουργούνται από ΤΝ σηματοδοτεί ένα σημείο καμπής, που θα μπορούσε να επιταχύνει ριζικά τη διαδικασία της επιστημονικής έρευνας και να πολλαπλασιάσει τις ανακαλύψεις - ή να την πνίξει σε αυτοματοποιημένη μετριότητα. Η ΤΝ μπορεί να παράγει έρευνα πολύ πιο γρήγορα απ' ό,τι μπορούν να τη διαβάσουν οι άνθρωποι, απειλώντας να θάψει ένα ήδη τεταμένο σύστημα αξιολόγησης από ομότιμους κάτω από ένα βουνό αυτοματοποιημένων υποβολών.

Η επιστήμη βασιζόταν πάντα στο μυαλό ενός ανθρώπου που διαμορφώνει μια υπόθεση, σχεδιάζει ένα πείραμα, αναλύει τα αποτελέσματα και παρουσιάζει την υπόθεση στους ομότιμούς του. Με την πάροδο των αιώνων έχουμε κατασκευάσει καλύτερα εργαλεία, όπως ηλεκτρονικά μικροσκόπια, επιταχυντές σωματιδίων και υπερυπολογιστές, αλλά ο βασικός βρόχος της επιστημονικής ανακάλυψης παρέμεινε ανθρώπινος. Τώρα, για πρώτη φορά, σε αυτόν τον βρόχο ο άνθρωπος μπορεί να αντικατασταθεί από ένα νέο είδος «νου».

Ταχύτατη μετριότητα

Η εργασία πέρασε από αξιολόγηση από ομότιμους για ένα εργαστήριο στο Διεθνές Συνέδριο για τις Αναπαραστάσεις Μάθησης (ICLR) του 2025, έναν κορυφαίο χώρο στον τομέα της μηχανικής μάθησης. Η εργασία ήταν μέτρια, σύμφωνα με τους ειδικούς, αλλά αρκετά αξιόλογη για να παρουσιαστεί αν την είχε γράψει άνθρωπος. Η ΤΝ παρήγαγε μια τυπικά αποδεκτή εργασία για τη μηχανική μάθηση μέσα σε 15 ώρες, με κόστος γύρω στα 140 δολάρια. Ενας μεταπτυχιακός φοιτητής μπορεί να χρειαστεί ένα ολόκληρο εξάμηνο για να γράψει την πρώτη του αποδεκτή εργασία.

Για να προστατευτούν από ενδεχόμενη «πλημμύρα» επιστημονικών εργασιών γραμμένων από ΤΝ, επιστημονικοί φορείς έχουν αρχίσει να θέτουν όρια, απορρίπτοντας τις εργασίες που είναι εξολοκλήρου γραμμένες από ΤΝ. Προς το παρόν οι συγγραφείς που χρησιμοποιούν ΤΝ πρέπει να δηλώνουν σαφώς πώς χρησιμοποιήθηκε. Ωστόσο, τα περιοδικά και τα συνέδρια συνήθως δεν διαθέτουν τα εργαλεία για την αξιόπιστη ανίχνευση συνεισφορών που δημιουργούνται από ΤΝ. Τα εργαλεία για την αυτόνομη συγγραφή αυτών των συνεισφορών έχουν ήδη αρχίσει να πολλαπλασιάζονται. Παραμένει το ερώτημα: Τι θα γίνει αν μια μέρα οι εργασίες που δημιουργούνται από ΤΝ πάψουν να είναι μέτριες;

Καλπασμός

Στο μεταξύ, η ραγδαία εξέλιξη της ΤΝ οδήγησε σε πολλά άλλα νέα δεδομένα τον τελευταίο μήνα. Ενα αυτόνομο ρομπότ - παίκτης πινγκ πονγκ με το όνομα Ace πέτυχε ένα ορόσημο για την ΤΝ και τη ρομποτική στο Τόκιο, νικώντας σε πολλές περιπτώσεις κορυφαίους ανθρώπους παίκτες. Είναι το πρώτο ρομπότ που επιτυγχάνει απόδοση επαγγελματικού επιπέδου σε ένα ανταγωνιστικό άθλημα φυσικής κατάστασης, που απαιτεί γρήγορες αποφάσεις και ακριβή εκτέλεση.

Μελέτη διαπίστωσε ότι μέχρι τα μέσα του 2025, περίπου το 35% των νέων δημοσιευμένων ιστότοπων είτε δημιουργήθηκαν εξολοκλήρου από ΤΝ, ή με τη βοήθειά της, από 0% πριν την κυκλοφορία του ChatGPT στα τέλη του 2022. «Ο πολλαπλασιασμός κειμένου που δημιουργείται και υποβοηθείται από την ΤΝ στο διαδίκτυο φοβόμαστε ότι συμβάλλει στην υποβάθμιση της σημασιολογικής και στιλιστικής ποικιλομορφίας, της ακρίβειας των πραγματικών περιστατικών και σε άλλες αρνητικές εξελίξεις», σημειώνουν οι ερευνητές.

Το μονοπώλιο «Meta» (του Facebook) θα ξεκινήσει την καταγραφή των κινήσεων του ποντικιού και των πληκτρολογήσεων των εργαζομένων της εταιρείας για να συγκεντρώσει δεδομένα, που θα αξιοποιηθούν για την εκπαίδευση της ΤΝ της «Meta», δηλώνοντας ότι τα δεδομένα ...δεν θα χρησιμοποιηθούν για αξιολογήσεις απόδοσης! Θα παίρνει μέχρι και περιστασιακά στιγμιότυπα του περιεχομένου των οθονών των εργαζομένων. Η πρωτοβουλία αποτελεί μέρος μιας ευρύτερης «αναμόρφωσης του εργατικού δυναμικού» της στον τομέα της ΤΝ. Η «Meta» σχεδιάζει απολύσεις που θα φτάσουν το 10% του προσωπικού της παγκοσμίως, ενώ, όπως και η πλειοψηφία των τεχνολογικών ομίλων, έχει περιορίσει πολύ τις προσλήψεις μη έμπειρου τεχνικού προσωπικού.

Τη βδομάδα που πέρασε, και η «Google» υπέγραψε συμφωνία με το Πεντάγωνο ανάλογη με αυτή που υπέγραψε η «OpenAI» για απόρρητη χρήση των μοντέλων της, παρά τις δημόσιες αντιδράσεις των εργαζομένων του ομίλου. Η δε «Anthropic» υποτίθεται ότι έχει εξοβελιστεί από συνεργασίες με το αμερικανικό κράτος και τα δικά της μοντέλα συνεχίζουν να χρησιμοποιούνται από ορισμένες υπηρεσίες και οργανισμούς που συνδέονται με το υπουργείο Πολέμου των ΗΠΑ.

Ανταγωνισμός

Στο πλαίσιο του ανταγωνισμού με τις ΗΠΑ για την πρωτοκαθεδρία, η Κίνα ακύρωσε τη συμφωνία εξαγοράς της κινεζικής «Manus» από την αμερικανική «Meta», στέλνοντας μήνυμα ότι είναι αποφασισμένη να μην επιτρέψει αμερικανική πρόσβαση στα επιτεύγματα της κινεζικής ΤΝ.

Ο Λευκός Οίκος κατηγόρησε την Κίνα ότι αντιγράφει αμερικανικά μοντέλα ΤΝ «σε βιομηχανική κλίμακα». Μία μέρα μετά, η κινεζική «DeepSeek» κυκλοφόρησε το νέο της μοντέλο DeepSeek-V4, προκαλώντας αίσθηση. Πριν από έναν χρόνο και κάτι, είχε συγκλονίσει τη βιομηχανία της ΤΝ κυκλοφορώντας ένα ανοιχτό μοντέλο, το R1, που είχε κατασκευάσει με κλάσμα του κόστους των καλύτερων αμερικανικών της εποχής, ενώ ήταν ισάξιο με αυτά και η χρήση του κόστιζε μόνο ένα μικρό ποσοστό των αμερικανικών. Το DeepSeek-V4 είναι επίσης ανοιχτό, ελαφρώς υποδεέστερο από τα σημερινά κορυφαία μοντέλα των ΗΠΑ (Claude Opus 4.7 και GPT5.5), ωστόσο ασκεί σοβαρή πίεση, καθώς η χρήση του κοστίζει λιγότερο από το ένα έκτο των αμερικανικών, ενώ έχει εκπαιδευτεί και λειτουργεί κυρίως με κινεζικούς επεξεργαστές, καθώς οι ΗΠΑ έχουν απαγορεύσει στην «Nvidia» την εξαγωγή των ισχυρότερων μοντέλων επεξεργαστών γραφικών της στην Κίνα.