Θεωρία

Το σκάκι στην εποχή της –αυτοδίδακτης– μηχανής

Το σκάκι είναι προορισμένο για την ισοπαλία: Όταν δυο ισάξιοι, ορθολογικοί αντίπαλοι παίξουν βέλτιστα, κανένας τους δεν θα «πάρει κεφάλι» και αργά ή γρήγορα θα δώσουν τα χέρια, μοιραζόμενοι από μισό βαθμό. Όσον αφορά το ELO, άρα και την κατάταξη στην Παγκόσμια Σκακιστική Ομοσπονδία (FIDE), εκεί ισχύει ένας μαθηματικός τύπος που επιβραβεύει τον αδύναμο σε βάρος του ισχυρού. Παραδείγματος χάρη, η ισοπαλία ενός άσημου παίκτη κόντρα στον Carlsen θα ανέβαζε το ELO του πρώτου και θα χαντάκωνε το ELO του δεύτερου. Στο πλαίσιο της ίδιας διοργάνωσης, η νίκη αξίζει 1 βαθμό και η ισοπαλία 0,5, ανεξαρτήτως δυναμικότητας των παικτών.

Όσο ανεβαίνει το επίπεδο, από Διεθνείς Μαιτρ (IM) σε Γκραντ Μαιτρ (GM) και επίδοξους παγκόσμιους πρωταθλητές («Super-GM» του 2800+), η «ισότητα για ίσους» υπονομεύεται απ’ τη βαριά και εν πολλοίς αχώνευτη θεωρητική γνώση. Προϊόν εκατομμυρίων παρτίδων που έχουν παιχτεί, καταγραφεί και μελετηθεί εδώ και αιώνες, η θεωρία εκκινεί από μερικές δεκάδες ανοίγματα για τα μαύρα και τα λευκά κι εμβαθύνει σε όλο και περισσότερες διακλαδώσεις στην πορεία της παρτίδας – σαν ένα δενδροδιάγραμμα που πλατειάζει εκθετικά. Νέες βαριάντες (παραλλαγές γνωστών ανοιγμάτων) δοκιμάζονται και καταρρίπτονται κάθε στιγμή, σε μια ατέρμονη εξελικτική διαδικασία που μιμείται την ίδια τη Φύση. Νέες «μόδες» αναδύονται και σβήνουν. Οι μονομάχοι, διαβασμένοι ο ένας για τις προτιμήσεις του άλλου, προετοιμάζουν παγίδες που θα τους «βγάλουν απ’ τα νερά τους» και θα τους παρασύρουν σε μια δίνη άγνωστων κινήσεων (οι οποίες, όμως, είναι λιγότερο άγνωστες για εκείνον που έστησε την παγίδα).

Ο δεύτερος καταλυτικός παράγοντας είναι ο χρόνος: Όσο πιο άγνωστη είναι μια θέση (position) τόσο περισσότεροι υπολογισμοί θα εκτελεστούν πάνω απ’ τη σκακιέρα, ενώ, όπως εξηγεί και ο μεγάλος Vishy Anand εδώ: Είναι διαφορετική η προσέγγιση μιας θέσης που ξέρεις ότι κερδίζει –κι απομένει να βρεις το πώς– και διαφορετική η προσπάθεια εκτίμησης της συνολικής εικόνας από το μηδέν. Οι μεγάλοι παίκτες, όπως κι οι υπολογιστές, ενεργούν βάσει «αναγνώρισης μοτίβων»: Αν η όψη της σκακιέρας είναι ευνοϊκή (σ’ αυτό το σημείο, το σκάκι διεκδικεί μια «αρμονία» ανάλογη της Τέχνης), ο παίκτης αναπτύσσεται και επιτίθεται. Αν οι σχέσεις των κομματιών του είναι χαλαρές κι η θέση επίφοβη, ο παίκτης αναδιπλώνεται (σε αναζήτηση σωτηρίας). Οι αλληλοκαλύψεις, ο έλεγχος στηλών και διαγωνίων, ο έλεγχος του Κέντρου, η ασφάλεια του Βασιλιά... είναι μερικά απ’ τα κριτήρια της «αναγνώρισης μοτίβων», που εν πολλοίς γίνεται ενστικτωδώς (φυσικά προηγείται η καταμέτρηση του υλικού). Ο τρίτος καθοριστικός παράγων είναι το ανθρώπινο λάθος: Απόρροια κόπωσης, ψυχολογίας (υπεραισιόδοξης ή ηττοπαθούς), μειωμένου ενδιαφέροντος ή/και διαβάσματος, απόσπασης προσοχής, κακής φόρμας του παίκτη σε μια δεδομένη στιγμή...

Σ’ επίπεδο ελίτ, το σκάκι θεωρείται άθλημα. Συγχρόνως ενσωματώνει επιστημονική μεθοδολογία κι αισθητικές αξίες. Ορισμένες παρτίδες, όπως π.χ. και κάποιες μαθηματικές αποδείξεις, δεν είναι μόνο χρήσιμες αλλά και όμορφες ως έργα τέχνης – και πρέπει να νιώθουμε τυχεροί που δεν εμπίπτουν στον Νόμο περί Πνευματικής Ιδιοκτησίας! Οι παλιότεροι σκακιστές περιβάλλονταν απ’ την αίγλη της «αυθεντίας»: Η μάχη των υπερδυνάμεων έκανε πρώτη είδηση τον τελικό Fischer - Spassky το ’72. Η ΕΣΣΔ αποκαθηλώθηκε σ’ ένα ακόμη διανοητικό πεδίο μετά το λεγόμενο space race, με την προσελήνωση του Apollo 11 τον Ιούλιο του ’69. Ο Fischer έγινε ίνδαλμα. Ο τελικός μεταξύ Karpov - Korchnoi μονοπώλησε το ενδιαφέρον (και το μένος) του σοβιετικού Τύπου: Ο διεκδικητής Korchnoi είχε πρόσφατα αυτομολήσει στη Δύση κι αναγκάστηκε ν’ αγωνιστεί χωρίς σημαία. Τα ευτράπελα με «ύποπτα» γιαούρτια blueberry, γυαλιά ηλίου-καθρέφτες, ακτίνες Χ και υπνωτιστές –μάλιστα, οι υπνωτιστές του «αποστάτη» Korchnoi κατηγορούνταν για φόνο!– επισκίασαν το ματς.

Όμως η αίγλη του σκακιού και των μεγάλων παικτών ξεφτίζει («απομαγεύεται» που θα ’λεγαν οι παλιοί) μονομιάς στις 11/5/1997, όταν ο θρυλικός Garry Kasparov ηττάται από ένα κουτί ονόματι Deep Blue: εδώ οι απολαυστικές αντιδράσεις του ιδίου τρία χρόνια νωρίτερα, όταν τα ’χε βρει μπαστούνια μ’ ένα άλλο τέρας από σιλικόνη, το Chess Genius. Το σκάκι περνάει στα αζήτητα των εφημερίδων και των καναλιών, ενώ η αναγέννησή του στο Ίντερνετ αφορά μόνο τους μυημένους · όχι το ευρύ κοινό. Απόδειξη: Όλοι έχετε ακουστά τον Kasparov, ίσως και τον Fischer ή τον Karpov, αλλά σχεδόν κανείς τον Anand, τον Kramnik, τον Carlsen… Οι μεταδόσεις αγώνων συνοδεύονται από μια μπάρα άσπρου-μαύρου, που παλαντζάρει ανάλογα με την κρίση ενός προγράμματος (πολύ πιο ελαφριού απ’ το Deep Blue, συμβατού με οικιακά PC ή κινητά): Μια θέση είναι καλή όταν το λέει το πρόγραμμα, όχι οι anchormen, οι αναλυτές, τα αντίπαλα επιτελεία... Η «καλή» –σε ανθρώπινους όρους– κίνηση χαρακτηρίζεται ως «practical», αφού η «αντικειμενικά καλή» είναι αυτή που εισηγείται ο υπολογιστής. Ενίοτε συμπίπτουν...

Οι υπολογιστές νικούν χάρη στην ικανότητά τους να βλέπουν και ν’ αξιολογούν εκατομμύρια κινήσεις συγχρόνως («brute force»). Θεωρητικά, ένας υπολογιστής θα νικούσε τον οποιονδήποτε αντίπαλο αν είχε προ-εκτιμήσει όλους τις πιθανούς συνδυασμούς, όλων των πιθανών παρτίδων, κι ήξερε το βέλτιστο «δενδροδιάγραμμα» ανά πάσα στιγμή. Εδώ, όμως, ανακύπτει μια μικρή δυσκολία: Το πλήθος των προς εκτίμηση θέσεων (positions) της σκακιέρας είναι πολλαπλάσιο των ατόμων του γνωστού σε μας Σύμπαντος – άρα, ακόμη κι ο ισχυρότερος υπολογιστής δεν έχει αρκετή ύλη για ν’ αντιμετωπίσει το πρόβλημα μέσα σε εύλογο χρονικό διάστημα! Στην πράξη, οι αλγόριθμοι καταδύονται μέχρι ένα ορισμένο «βάθος» (αλληλουχία κινήσεων στο δενδροδιάγραμμα), εκκινώντας από τη θέση που τούς προέκυψε, ή τους δόθηκε προς ανάλυση. Με επίκεντρο τους minimax, alpha-beta (ανέξοδος περιορισμός των βημάτων του minimax) και bitboard (ταχύτερη εκτίμηση των positions) –ή ολίγη από Στατιστική (παλινδρομήσεις και gradient descent στην περίπτωση της τεχνητής νοημοσύνης (Α.Ι.))– οι μηχανές «κλαδεύουν» το δενδροδιάγραμμα, φθάνοντας σε βαθύτερες θέσεις.

Ο πανίσχυρος AlphaZero (A.I.) διερευνά περί τις 80.000 θέσεις το δευτερόλεπτο, ενώ το αντίπαλο δέος, Stockfish (συμβατικής τεχνολογίας) καταπιάνεται με χίλιες φορές περισσότερες: 70.000.000 θέσεις! Ο Deep Blue, που εκθρόνισε τον Kasparov, μπορούσε να φτάσει τις 200.000.000 θέσεις/δευτερόλεπτο, σε βάθος 20 «κόμβων» (μικρότερο απ’ τα σημερινά προγράμματα, μολονότι ήταν εφοδιασμένος με έτοιμα ανοίγματα, τακτικές κι εκατοντάδες χιλιάδες παρτίδες, που στένευαν το εύρος των επιλογών). Σημειωτέον ότι ο Deep Blue είχε εξασκηθεί και κόντρα σε ανθρώπους grandmasters, που ήλεγχαν για ψεγάδια και βελτίωναν τον αλγόριθμο. Αντίστοιχα, το open-source πρόγραμμα Stockfish κυριάρχησε με την εισαγωγή του λεγόμενου Fishtest, ενός framework που δανείζεται μέρος των CPU διαφόρων εθελοντών για να δημιουργεί και να ελέγχει στατιστικά (να τη πάλι η Στατιστική, έστω και χωρίς A.I.) μεταλλάξεις του κώδικά του: Όταν μια «νέα» τυχαία εκδοχή παίζει με την «παλιά» κι επικρατεί με μεγάλη συχνότητα, παίρνει τη θέση της! Trial-and-error λοιπόν, αλλά προσοχή: στο πλαίσιο ενός προκαθορισμένου από ανθρώπους προγράμματος. Όχι εκ του μηδενός.

Στον αντίποδα, ο AlphaZero είναι ένας αλγόριθμος που αυτο-διδάχθηκε απ’ το μηδέν· όχι μόνο σκάκι, αλλά και shogi και go... Τα κριτήριά του δεν πηγάζουν απ’ την ανθρώπινη εμπειρία αλλά από δοκιμές που έκανε παίζοντας επί ένα 4ωρο με τον εαυτό του. Ομοίως, οι αλγόριθμοι A.I. («deep learning» ειδικότερα) εκπαιδεύονται σε μοτίβα όπως αναγνώριση φωνής, ή ταυτοποίηση σκύλων μέσα σ’ έναν ωκεανό από google images. Ο AlphaZero αυτο-εκπαιδεύτηκε, ελέγχοντας μέσω στατιστικών παλινδρομήσεων τ’ αποτελέσματα τυχαίων αυτοσχέδιων παρτίδων. Η τυχαιότητα μειώνεται όσο το πρόγραμμα αποφεύγει προηγούμενα λάθη (αποκλίσεις μαθηματικών παραμέτρων), αυξάνοντας τρόπον τινά το ELO του. Οι βασικές αρχές του «machine learning» και των νευρωνικών δικτύων μπορούν να δειχθούν με παραδείγματα από άλλα πεδία (π.χ. image recognition). Δεν έχει νόημα να εμβαθύνουμε στο πλαίσιο του παρόντος άρθρου... Αρκεί να επισημανθεί ότι οι κώδικες τέτοιων προγραμμάτων είναι ανέλπιστα σύντομοι, αφού περιγράφουν το τι πρέπει να γίνει (νίκη/ εύρεση σκύλου) και όχι το πώς (τακτικές για σκάκι/ περιγραφές σκύλων). Απομένει το «τάισμά» τους, από δεξαμενές δεδομένων (π.χ. εκατομμύρια φωτογραφίες, μεταξύ των οποίων και φωτογραφίες σκύλων που επισημαίνονται ως τέτοιες για να «προπονηθεί» ο αλγόριθμος). Εν προκειμένω δεν χρειάζεται database, παρά μόνο επεξεργαστική ισχύς που θα «τρέξει» εκατομμύρια παρτίδες («reinforcement»). Η έκβαση των παρτίδων –η οποία σηματοδοτεί το Καλό και το Κακό και προσανατολίζει ανάλογα το μαθηματικό μοντέλο– συναρτάται απ’ τους κανόνες του παιχνιδιού.

Πίσω στο ανθρώπινο σκάκι: Ο λόγος που ο Morphy, ο Lasker, ο Alekhine, ο Keres, ο Tal... έχουν αφήσει εποχή δεν είναι η ακρίβεια των κινήσεών τους (υπό τη βάσανο, και το βάσανο, ενός Stockfish), αλλά το ψυχικό και διανοητικό σοκ των αντιπάλων τους. Θυσιάζοντας κομμάτια, για να επωφεληθούν σε ρυθμό και ν’ ανοίξουν επιθετικές διόδους, οι παίκτες αυτοί έθεταν δύσκολα ερωτήματα με μία και μοναδική λύση, σε πεπερασμένο χρόνο, σ’ έναν αντίπαλο χωρίς την επεξεργαστική ισχύ του υπολογιστή. Η ίδια η θυσία μπορεί να μην ενθουσιάζει π.χ. το Stockfish, μα η αντίδραση του «θύματος» είναι ό,τι πρέπει για να γκρεμίσει την αξιολόγηση –ή το ανάλογο διάγραμμα– της θέσης του! [Είπαμε εξ αρχής ότι δεν νοείται «βελτιωτική» κίνηση, παρά μόνο λάθος που βελτιώνει τη θέση ή την τακτική του αντιπάλου]. Οι σημερινοί Super-GM, έχοντας αποστηθίσει τις «φαντεζί» ενέργειες των κλασικών, έχουν μάθει και να τις αποκρούουν. Το θέαμα είναι νεκρό. Οι νέοι τακτικιστές (βλ. Richard Rapport) πληρώνουν ακριβά το επιθετικό τους ταπεραμέντο.

Ωστόσο, ο αργός θάνατος του σκακιού δεν οφείλεται σ’ αυτό: Ο Kasparov έπαιζε «προκάτ» αλλά έπαιζε ισοπεδωτικά. Θεωρητικός δεν σημαίνει βαρετός ή μετριοπαθής, ενώ το ’90 και το 2000 δεν έλειπε η συσσωρευμένη εμπειρία αιώνων. Οι σημερινοί Super-GM εν αντιθέσει με τον Kasparov– παίζουν κινήσεις που δεν κατανοούν σε βάθος (!), διότι προέκυψαν απ’ τη μηχανική εκτίμηση 20 ή 30 κόμβων παρακάτω σ’ ένα δενδροδιάγραμμα. Σε πρόσφατο τελικό, ο θεωρούμενος ως Beethoven του σκακιού Magnus Carlsen εγκατέλειψε μια πολλά υποσχόμενη θέση, με περίσσεια χρόνου, για να υπερασπιστεί τον τίτλο του στα rapid (Eπειδή τυχγάνει να είναι πιο γρήγορος απ’ τον διεκδικητή Caruana). Η «δειλία» κάποιου που εκτελεί το πλάνο μιας μηχανήςμέχρι τη στιγμή που η μνήμη του τον εγκαταλείπει και πρέπει να πάρει τη σκυτάλη των μη-ανθρώπινων προθέσεών της– αυξάνει την τάση για ισοπαλία («drawish»). Το σκάκι καταντάει απόκοσμο, απωθητικό.

Την ίδια στιγμή, ο ανταγωνισμός μεταξύ μηχανών συγκεντρώνει όλο και μεγαλύτερο ενδιαφέρον: Εδώ, εδώ κι εδώ ξεχωρίζει το «σθένος» και η ελευθερία με την οποία ο αυτοδίδακτος AlphaZero αντιμετωπίζει το Stockfish, που διέπεται από μεγαλύτερο υλισμό και λιγότερη έμφαση στη δραστηριότητα (ένα σπάνιο αντι-παράδειγμα εδώ, όπου οι τακτικές του Stockfish βγάζουν νοκ άουτ τον AlphaZero απ’ την κίνηση 22). Εδώ, ένα παράδειγμα μη-ανθρώπινης κίνησης που κερδίζει. Εδώ ένα παράδειγμα μη-ανθρώπινης κίνησης (αυτο-εγκλωβισμός της λευκής Βασίλισσας, κόντρα σε βασικές αρχές αλλά και τη διαίσθηση του μέσου ανθρώπου...), που «τιμωρείται» απ’ την άλλη μηχανή. Το τρίτο κατά σειρά hyperlink της παραγράφου, όπως κι αυτό εδώ, μάς εισάγουν σε ένα βαθύτερο, σχεδόν νιτσεϊκό ερώτημα περί του Καλού και του Κακού: Ποιος αξιολογεί ποιον;! H προσφιλής μπάρα αξιολόγησης αχρηστεύεται, ενώ η άμεση υιοθέτηση της οπτικής του νικητή (αφού είναι γνωστό ποιοί γράφουν την Ιστορία...) δεν είναι θέσφατο: 1) Η κακοδιαχείριση χρόνου, ή κάποιο bug, θα μπορούσαν να ευθύνονται για την ήττα. 2) Έτσι κι αλλιώς, το αποτέλεσμα δεν επιμερίζεται ισομερώς ανά κίνηση. Πώς θα κριθεί η συγκεκριμένη κίνηση, όταν οι αντίπαλοι έχουν ανώτερο ELO (software + hardware) απ’ αυτό του παρατηρητή;

Τι είναι λοιπόν το σκάκι στην εποχή των έξυπνων μηχανών, άρα και του θανάτου της αυθεντίας – μαζί με τους υπνωτιστές, τα γκροτέσκα γυαλιά-καθρέφτες και τα σενάρια κατασκοπείας; Ίσως είναι η δικαίωση του καφενείου. Η επανεύρεση της χαράς του παιχνιδιού...

* Η φωτογραφία του άρθρου προέρχεται απ’ τον πιο σουρεάλ τελικό όλων των εποχών: Είναι τα γυαλιά του Korchnoi (Αν σήκωνε λίγο το βλέμμα του, θα βλέπαμε το πρόσωπο του Karpov). Φιλιππίνες, 1978.
** Στο βίντεο απαθανατίζονται τέσσερις απ’ τους κορυφαίους σύγχρονους παίκτες που, απαλλαγμένοι απ’ το βαθμολογικό άγχος, επιδίδονται σε καφενειακό σκάκι («δυάδες») και χαίρονται σαν μικρά παιδιά.

Σχετικά με τον αρθρογράφο

Ρένος Μάρτης