Το ρομπότ iCub. |
Στην πραγματικότητα, ήδη αρκετές μηχανές ξεπερνούν τις ικανότητες του ανθρώπου σε συγκεκριμένες δραστηριότητες, όπως το παίξιμο παιχνιδιών, σαν το Jeopardy, το σκάκι και το πολύπλοκο κινέζικο παιχνίδι Go. Τον περασμένο Οκτώβρη, η βρετανική εταιρεία «DeepMind» αποκάλυψε το σύστημα AlphaGo Zero, την πιο τελειοποιημένη εκδοχή ΤΝ για το παιχνίδι Go. Σε αντίθεση με τον προκάτοχό της, το AlphaGo, που είχε γίνει ο καλύτερος παίχτης μελετώντας τεράστιο αριθμό παρτίδων μεταξύ ανθρώπων, το AlphaGo Zero συγκέντρωσε την απαραίτητη εμπειρία αυτόνομα, παίζοντας με τον εαυτό του. Τουλάχιστον μέχρι τη μέρα της ανακοίνωσης της DeepMind, η νέα ΤΝ μπορούσε να αποκτήσει δεξιότητες μόνο σε αντικείμενα με ξεκάθαρους κανόνες, όπως τα παιχνίδια.
Αντίθετα με τις έως τώρα ΤΝ, τα παιδιά των ανθρώπων από τη βρεφική ηλικία αναπτύσσονται νοητικά, εξερευνώντας το περιβάλλον τους και πειραματιζόμενα με την κίνηση και την ομιλία. Μαζεύουν δεδομένα από μόνα τους, προσαρμόζονται σε νέες καταστάσεις και εφαρμόζουν δεξιότητες που απέκτησαν σε κάποιον τομέα, οπουδήποτε αλλού μπορούν αυτές να βρουν εφαρμογή.
Από την αρχή του 21ου αιώνα, ρομποτιστές, νευροεπιστήμονες και ψυχολόγοι αναζητούν τρόπους για να κατασκευάσουν μηχανές που θα μιμούνται αυτήν την αυθόρμητη ανάπτυξη. Οι συνεργασίες τους έχουν οδηγήσει σε ανδροειδή, που μπορούν να μετακινήσουν αντικείμενα, να αποκτήσουν βασικές γλωσσικές και αριθμητικές ικανότητες, ακόμη και να δείξουν κάποια σημάδια κοινωνικής συμπεριφοράς. Κάποιοι ψυχολόγοι θεωρούν ότι μέσω των συστημάτων ΤΝ μπορούν να κατανοήσουν καλύτερα τον τρόπο που μαθαίνουν τα παιδιά. Είναι όμως γενικοί νόμοι της μάθησης αυτά τα χαρακτηριστικά που δείχνουν τα συγκεκριμένα συστήματα ΤΝ, ή είναι απλώς ιδιορρυθμίες των συστημάτων αυτών, ή ίσως προβολές προτύπων της ανθρώπινης μάθησης πάνω τους;
Ο εγκέφαλος του ανθρώπου προσπαθεί συνεχώς να προβλέψει το μέλλον και όταν διαπιστώνει αποκλίσεις, τροποποιεί τις προσδοκίες του για να ταιριάξουν με την πραγματικότητα. Σύμφωνα με νευροεπιστήμονες, τα υψηλότερου επιπέδου κέντρα επεξεργασίας στον εγκέφαλο τροποποιούν τα μοντέλα που αναπτύσσουν, με κριτήριο τα σήματα που λαμβάνουν από τα χαμηλότερου επιπέδου κέντρα επεξεργασίας των σημάτων αυτών. Ορισμένοι θεωρούν ότι υπάρχει και ανατροφοδότηση από τα ανώτερου στα κατώτερου επιπέδου κέντρα επεξεργασίας, με αποτέλεσμα να επηρεάζονται οι αισθήσεις, όπως συμβαίνει στις οφθαλμαπάτες.
Η αλληλεπίδραση των σημάτων προς τα πάνω με τα σήματα προς τα κάτω, δημιουργεί ένα λάθος πρόβλεψης: Τη διαφορά ανάμεσα σε αυτό που περιμένουμε και σε αυτό που πραγματικά βιώνουμε. Ενα σήμα μεταφέρει αυτήν τη διαφορά στα ανώτερα κέντρα επεξεργασίας, ώστε να διορθώσουν την πρόβλεψή τους και ο ατέρμονος κύκλος συνεχίζεται, ελαχιστοποιώντας τη διαφορά ανάμεσα στην πρόβλεψη και το βίωμα.
Μια θεμελιώδης διαφορά ανάμεσα στον άνθρωπο και τα σημερινά συστήματα ΤΝ είναι ότι διαθέτουμε σώμα με το οποίο μπορούμε να μετακινηθούμε στο περιβάλλον και να επενεργήσουμε πάνω του. Τα βρέφη και τα μικρά παιδιά αναπτύσσονται νοητικά, δοκιμάζοντας τις κινήσεις των χεριών, των ποδιών, των δακτύλων τους, περιεργαζόμενα καθετί το οποίο φτάνουν. Το πώς με πολύ μικρή καθοδήγηση καταφέρνουν αυτόνομα αυτήν την αρχική φάση ανάπτυξης είναι κλειδί τόσο για τη δουλειά των αναπτυξιακών ψυχολόγων, όσο και των ρομποτιστών. Η συνεργασία τους φέρνει απρόσμενες διαπιστώσεις και στα δύο επιστημονικά πεδία.
Ηδη από το τέλος της δεκαετίας του 1990, ρομποτιστές είχαν παρατηρήσει ότι ρομπότ με νευρωνικά δίκτυα βασισμένα στη διαδικασία πρόβλεψης - διόρθωσης μπορούσαν να αποκτήσουν στοιχειώδεις δεξιότητες πλοήγησης μεταξύ εμποδίων, μίμησης κινήσεων των χεριών και ανταπόκρισης σε απλές προφορικές εντολές. Το 2015, ρομποτιστές και αναπτυξιακοί ψυχολόγοι στο πανεπιστήμιο του Πλίμουθ έδειξαν πόσο κρίσιμη είναι η ύπαρξη του σώματος για την απόκτηση γνώσης. «Το σχήμα του σώματος του ρομπότ και τα πράγματα που μπορεί να κάνει με αυτό επηρεάζουν τις εμπειρίες που έχει και τι μπορεί να μάθει από αυτές», λέει η Λίντα Σμιθ, μια από τους ερευνητές. Στα πειράματά τους χρησιμοποίησαν κυρίως το iCub, ένα ανθρωπόμορφο ρομπότ ύψους ενός μέτρου, που κατασκευάστηκε από το Ιταλικό Ινστιτούτο Τεχνολογίας για ερευνητικούς σκοπούς και από κατασκευής δεν έχει προγραμματισμένη καμία λειτουργία.
Στα πειράματα με το iCub, οι ερευνητές διαπίστωσαν ότι το νευρωνικό δίκτυο, που του έβαλαν, του έδωσε τη δυνατότητα να μαθαίνει συσχετίσεις ανάμεσα σε λέξεις και αντικείμενα και αυτό να το πετυχαίνει καλύτερα, όταν πρόφεραν την ονομασία του αντικειμένου δείχνοντάς το στο ρομπότ στην ίδια θέση στο χώρο γύρω του. Η ΤΝ μάθαινε καλύτερα συσχετίζοντας τις κινήσεις που έπρεπε να κάνει το ανδροειδές, ώστε να δει το αντικείμενο. Οταν οι επιστήμονες έκαναν το ίδιο πείραμα με μωρά 16 μηνών, παρατήρησαν το ίδιο φαινόμενο. Συγκεκριμένες στάσεις βοηθούσαν τα μωρά να συσχετίσουν καλύτερα τις λέξεις με τα αντικείμενα. Οι ερευνητές διαπίστωσαν ακόμη ότι τα ρομπότ τους μάθαιναν πιο εύκολα τις βασικές ικανότητες αρίθμησης, όταν η συσχέτιση των αριθμών γινόταν με τα δάχτυλά τους, παρά όταν τους επιδεικνυόταν διαφορετικός αριθμός αντικειμένων.
Η περιέργεια για το άγνωστο και το ασυνήθιστο επίσης βοηθά τα παιδιά να μάθουν. Ο Πιερ Ιβ Ουντεγιέ, του γαλλικού εθνικού ινστιτούτου επιστήμης υπολογιστών, θεωρεί ότι τα παιδιά αναζητούν ενστικτωδώς τα αντικείμενα του περιβάλλοντος που προσφέρουν τις μεγαλύτερες δυνατότητες για μάθηση. Για να δοκιμάσει τη θεωρία του, στράφηκε σε ρομποτικά συστήματα, στα οποία έδωσε ένα χαρακτηριστικό εσωτερικού κινήτρου: Την επιβράβευση για τη μείωση του λάθους πρόβλεψης (για μια ΤΝ επιβράβευση μπορεί να είναι η αύξηση αριθμητικής ποσότητας, την οποία έχει προγραμματιστεί να μεγιστοποιεί μέσω των πράξεών της). Την ΤΝ την έβαλε στα μικρά ρομποτικά σκυλάκια AIBO της «Sony», διαπιστώνοντας ότι σύντομα απέκτησαν βασικές δεξιότητες, όπως το να πιάνουν αντικείμενα και να αλληλεπιδρούν φωνητικά μεταξύ τους, χωρίς να τους έχει προγραμματιστεί καμία από αυτές τις λειτουργίες. Μάλιστα, παρότι τα ρομποτάκια πέρασαν από τις ίδιες φάσεις εκπαίδευσης, οι τυχαίες μικροδιαφορές στο περιβάλλον, τα οδήγησαν να αποκτήσουν διαφορετικές γνώσεις, όπως συμβαίνει και στα ομοζυγωτικά δίδυμα.
Σε άλλο πείραμα με το iCub, ερευνητές στην Ιαπωνία έδειξαν ότι χωρίς να προγραμματίσουν στο ρομπότ κάποια τάση κοινωνικοποίησης, το κίνητρο της μείωσης του λάθους πρόβλεψης, το έκανε να προσπαθήσει να «βοηθήσει» τον πειραματιστή, όταν εκείνος έκανε σκόπιμα λάθος σε μια κίνηση, που είχε ήδη μάθει να κάνει το ρομπότ. Αν ο πειραματιστής έκανε πως δεν μπορούσε να μετακινήσει ένα παιχνίδι - φορτηγάκι στην κατάλληλη θέση, το iCub συχνά το μετακινούσε το ίδιο. Σύμφωνα με την επικεφαλής του πειράματος, Γιούκι Ναγκάι, «ένα μωρό δεν χρειάζεται να έχει την πρόθεση να βοηθήσει άλλους ανθρώπους», το κίνητρο της ελαχιστοποίησης του λάθους πρόβλεψης είναι από μόνο του αρκετό για να εκκινήσει στοιχειώδεις κοινωνικές ικανότητες.
Ερευνητές προσπαθούν τώρα να αναπτύξουν εργαλεία που θα εντοπίζουν ανάμεσα στα δισεκατομμύρια εικονικά «εγκεφαλικά κύτταρα», των συστημάτων ΤΝ, εκείνα που είναι πιθανώς προβληματικά. Πολλά προγράμματα αναγνώρισης εικόνας, συστήματα αυτόματης οδήγησης και άλλες μορφές ΤΝ χρησιμοποιούν νευρωνικά δίκτυα, των οποίων οι «νευρώνες» τροφοδοτούνται με δεδομένα και συνεργάζονται για την επίλυση ενός προβλήματος, όπως ο εντοπισμός εμποδίων στο δρόμο. Το δίκτυο «μαθαίνει» ρυθμίζοντας επανειλημμένως τις συνδέσεις μεταξύ των νευρώνων του και ξαναπροσπαθώντας να λύσει το πρόβλημα. Στην πορεία, το σύστημα προσδιορίζει τα μοτίβα νευρωνικών συνδέσεων που δίνουν τις καλύτερες λύσεις. Τελικά, μονιμοποιεί τη χρήση των βέλτιστων μοτίβων, μιμούμενο τον τρόπο που λειτουργεί ο ανθρώπινος εγκέφαλος.
Πρόβλημα - κλειδί σε αυτήν την τεχνολογία είναι ότι οι ερευνητές συχνά δεν γνωρίζουν πώς τα νευρωνικά δίκτυα φτάνουν στις συγκεκριμένες αποφάσεις τους. Αυτό κάνει δύσκολο να βρεθεί τι πήγε στραβά όταν γίνεται κάποιο λάθος, λέει ο Γιουνφένγκ Γιανγκ, του πανεπιστημίου Κολούμπια. Ο Γιανγκ και οι συνεργάτες του κατασκεύασαν το DeepXplore, ένα πρόγραμμα σχεδιασμένο για να κάνει εκσφαλμάτωση σε συστήματα ΤΝ, πραγματοποιώντας αντίστροφη μηχανική στις διαδικασίες εκμάθησης που χρησιμοποιούν. Δοκιμάζει ένα νευρωνικό δίκτυο με μια ποικιλία δεδομένων εισόδου και ενημερώνει το δίκτυο όταν οι αντιδράσεις του είναι λαθεμένες, ώστε να μπορέσει να διορθωθεί. Για παράδειγμα, το DeepXplore θα μπορούσε να προσδιορίσει αν μια εικόνα από κάμερα που τροφοδοτήθηκε στην ΤΝ οδήγησης ενός αυτοκινήτου προκάλεσε λαθεμένη στροφή του οχήματος με αποτέλεσμα να πέσει πάνω σε πεζούς. Το εργαλείο εκσφαλμάτωσης παρακολουθεί επίσης ποιοι νευρώνες ενός δικτύου είναι ενεργοί και δοκιμάζει τον καθένα ξεχωριστά. Προηγούμενα συστήματα εκσφαλμάτωσης δεν μπορούσαν να πουν αν κάθε νευρώνας είχε ελεγχθεί για λάθη.
Σε δοκιμές σε 15 νευρωνικά δίκτυα τελευταίας τεχνολογίας - συμπεριλαμβανομένων μερικών που χρησιμοποιούνται σε συστήματα αυτόνομης οδήγησης, αλλά και σε συστήματα εντοπισμού κακόβουλου λογισμικού σε υπολογιστές - το DeepXplore ανακάλυψε χιλιάδες σφάλματα, που είχαν διαφύγει προηγούμενων τεχνολογιών εκσφαλμάτωσης. Ετσι ορισμένα συστήματα αύξησαν την ακρίβειά τους κατά 1% - 3%, φτάνοντας μέχρι και 99%. Ερώτημα παραμένει τι γίνεται με το υπολειπόμενο 1% της ακρίβειας (σωστής επιλογής π.χ. για το αν και προς τα πού πρέπει να στρίψει ένα όχημα), όπως και για το πόσα σφάλματα θα εντοπίσει κάποιο επόμενο καλύτερο λογισμικό εκσφαλμάτωσης.