Το 1967, ο Μάρβιν Μίνσκι, του Ινστιτούτου Τεχνολογίας της Μασαχουσέτης (ΜΙΤ), που πέθανε νωρίτερα φέτος, είχε διακηρύξει ότι οι προκλήσεις της τεχνητής νοημοσύνης (ΤΝ) θα είχαν βρει την απάντησή τους μέσα σε μια γενιά. Η αισιοδοξία αυτή αποδείχτηκε υπερβολική. Το λογισμικό που σχεδιάστηκε για να βοηθάει τους γιατρούς στις διαγνώσεις τους («έμπειρα συστήματα») και το λογισμικό αναγνώρισης προσώπων σε φωτογραφίες δεν ήταν στο επίπεδο των διακηρύξεων και των απαιτήσεων. Οι αλγόριθμοι δεν ήταν αρκετά εξελιγμένοι, τα διαθέσιμα δεδομένα εισόδου προς επεξεργασία ήταν ανεπαρκή, ενώ έλειπε εκείνη την εποχή και η απαραίτητη επεξεργαστική ισχύς των ηλεκτρονικών υπολογιστών. Εως το μέσο της δεκαετίας του 2000, η ιδέα της κατασκευής μηχανών με νοημοσύνη ανθρώπινου επιπέδου, έστω σε επιμέρους τομείς, είχε καταπέσει στη συνείδηση της επιστημονικής κοινότητας. Εκείνη την περίοδο οποιαδήποτε αναφορά στην ΤΝ είχε φτάσει να θεωρείται απομάκρυνση από τη σοβαρή επιστήμη.
Η βαθιά μηχανική μάθηση προσομοιώνει νευρωνικά δίκτυα, ώστε σταδιακά να «μαθαίνει» να αναγνωρίζει εικόνες, να καταλαβαίνει την ομιλία, να παίρνει αποφάσεις για διάφορα ζητήματα. Στα νευρωνικά δίκτυα οι συνδέσεις μεταξύ των ψηφιακών νευρώνων ενισχύονται ή αδυνατίζουν μετά από κάθε παράδειγμα που τους δίνεται προς επεξεργασία, επιβεβαιώνοντας ή ακυρώνοντας την απάντηση που έδωσαν με τη μέχρι εκείνη τη στιγμή «γνώση» τους.
Κάθε νευρωνικό στρώμα ενός συστήματος βαθιάς μηχανικής μάθησης μετασχηματίζει την είσοδο που λαμβάνει και παράγει ένα αποτέλεσμα (έξοδος) που τροφοδοτείται στο επόμενο στρώμα. Οσο βαθύτερο είναι το στρώμα, τόσο πιο αφαιρετικές είναι οι έννοιες τις οποίες διαχειρίζεται, πιο απόμακρες από τα πρωτογενή αρχικά δεδομένα. Για παράδειγμα, από μια αρχική φωτογραφία, σε κάποιο βάθος μέσα στο δίκτυο αναπτύσσεται η έννοια του επίπλου γραφείο, χωρίς αυτό να έχει προσδιοριστεί και ονομαστεί εκ των προτέρων. Σε επόμενο επίπεδο, το έπιπλο γραφείο μπορεί να μετατραπεί σε στοιχείο μιας πιο γενικής έννοιας, όπως το δωμάτιο γραφείο, ο χώρος εργασίας. Προβλήματα με τους αλγορίθμους που συχνά κατέληγαν σε «τοπικά ελάχιστα» και όχι στο γενικό ελάχιστο, δηλαδή τη βέλτιστη απάντηση στο ερώτημα που τίθεται, ξεπεράστηκαν όταν αυξήθηκε αρκετά το μέγεθος του νευρωνικού δικτύου των συστημάτων βαθιάς μηχανικής μάθησης. Η σχετική έρευνα προχωρά τόσο σε πειραματικό, όσο και σε θεωρητικό επίπεδο.
Σαφώς υπάρχουν τεράστιες διαφορές ανάμεσα σε ένα μηχάνημα που «μαθαίνει» και έναν άνθρωπο με αυτοσυνείδηση που μαθαίνει, ωστόσο το αποτέλεσμα, η έξοδος από το «μαύρο κουτί» ανθρώπινος εγκέφαλος και από το «μαύρο κουτί» ΤΝ έχει φτάσει να είναι η ίδια σε επιμέρους τομείς, χωρίς βέβαια - ευτυχώς - το μηχάνημα ΤΝ να έχει αποκτήσει αυτοσυνείδηση (αν υποθέσουμε ότι κάτι τέτοιο μπορεί να συμβεί).
Η τεχνολογία της βαθιάς μηχανικής μάθησης έχει μεταμορφώσει την έρευνα για την ΤΝ, αναβιώνοντας παλιές φιλοδοξίες, σε σχέση με τη μηχανική όραση, την αναγνώριση γλώσσας, την επεξεργασία ομιλούμενης γλώσσας και τη ρομποτική. Ηδη από το 2012, η εταιρεία πίσω από την πιο διαδεδομένη μηχανή αναζήτησης στο Διαδίκτυο έχει βγάλει σε δημόσια χρήση τεχνολογίες κατανόησης λόγου (μετατροπής σε γραπτό κείμενο) και αναγνώρισης προσώπων σε φωτογραφίες. Εντυπωσιακό είναι το πόσο μικρή εντύπωση προκάλεσε το γεγονός. Αντιμετωπίστηκε, από το σημερινό εξοικειωμένο στην πανταχού παρούσα τεχνολογία κόσμο, ως μια φυσική εξέλιξη, που μάλιστα θα έπρεπε να είχε έρθει πολύ νωρίτερα, χωρίς να γίνει ιδιαίτερη συζήτηση για άλλες πλευρές του ζητήματος, όπως οι επιπτώσεις σε ό,τι έχει απομείνει από την «προσωπική ζωή», στις νέες δυνατότητες των μηχανισμών καταστολής, στην ίδια τη βήμα - βήμα διεύρυνση των δυνατοτήτων της ΤΝ στην κατεύθυνση που προσέβλεπαν οι ιδρυτές του τομέα. Πιο πολλή συζήτηση έγινε για τη χαρά που δίνει το γεγονός ότι τώρα αντί να γράψεις μπορείς να μιλήσεις στον υπολογιστή (π.χ. του κινητού σου) και να καταλάβει τι του λες, ότι στα κοινωνικά δίκτυα αν βάλεις ετικέτα με το όνομα κάποιου σε μια φωτογραφία, αυτόματα αυτός αναγνωρίζεται σε οποιαδήποτε άλλη φωτογραφία του στο Διαδίκτυο, ή ότι το σύστημα αυτόνομης οδήγησης μπορεί να διακρίνει ένα αντικείμενο από ένα ζώο ή έναν άνθρωπο και να αποφασίσει αν θα το πατήσει ή θα κάνει ελιγμό για να το αποφύγει.
Αγνωστο είναι αν και με ποιον τρόπο και σκοπό απασχολούνται κρατικοί υπερυπολογιστές ανά τον κόσμο με συστήματα βαθιάς μηχανικής μάθησης.
Οι πρόοδοι αυτές άνοιξαν την πόρτα για περαιτέρω εμπορική χρήση της τεχνολογίας ΤΝ και ο ενθουσιασμός των μονοπωλίων και των καταναλωτών «γκάτζετς» συνεχίζει να μεγαλώνει. Στις ΗΠΑ, τα μονοπώλια του κλάδου χρυσώνουν καθηγητές πανεπιστημίου και κατόχους σχετικού διδακτορικού για να εγκαταλείψουν την ακαδημαϊκή θέση και να φτιάξουν ό,τι τους ζητούν.
Η εξέλιξη είναι πραγματικά γρήγορη και εντυπωσιακή. Μετά από την ντάμα και το σκάκι, ο θρίαμβος ενός νευρωνικού δικτύου απέναντι στον Λι Σι Ντολ, κορυφαίο παίκτη του σύνθετου παιχνιδιού Go, έδωσε πρωτοσέλιδα. Τώρα οι εφαρμογές της βαθιάς μηχανικής μάθησης επεκτείνονται σε άλλους τομείς της ανθρώπινης εξειδίκευσης και όχι βέβαια μόνο σε άλλα παιχνίδια. Ενας από τους πιο πρόσφατα αναπτυγμένους αλγορίθμους βαθιάς μάθησης αποσκοπεί στο να κάνει διάγνωση καρδιακής ανεπάρκειας από μαγνητικές τομογραφίες το ίδιο καλά με έναν καρδιολόγο. Φυσικά το ζήτημα δεν είναι να μην αναπτυχθεί ένα τέτοιο σύστημα, που θα μπορούσε να δώσει λύσεις σε προβλήματα διάγνωσης σε δύσκολες περιστάσεις, ή να χρησιμοποιηθεί ως βοηθητικό εργαλείο στη δουλειά του γιατρού. Το ζήτημα είναι τι επιπτώσεις θα έχει στους εργαζομένους η εφαρμογή τεχνολογιών ΤΝ στο καπιταλιστικό πλαίσιο, όπου η επιβίωση των ανθρώπων είναι αποκλειστικά δική τους ευθύνη, ανεξάρτητα και κόντρα στις εξαιρετικά αντίξοες συνθήκες που δημιουργεί το ίδιο το εκμεταλλευτικό σύστημα, ακριβώς επειδή είναι εκμεταλλευτικό και λειτουργεί για το κέρδος των λίγων και όχι για την ευημερία όλων των ανθρώπων.