Nel precedente articolo abbiamo analizzato l’impatto dell’Intelligenza Artificiale sugli scacchi e sul Go.
In entrambi i casi è emerso come i software di ultima generazione siano un avversario (quasi) impossibile da battere anche per i grandi campioni umani. Al tempo stesso, però, sono anche uno strumento insostituibile per chi vuole migliorare le proprie skills ludiche.
La prospettiva in parte cambia se ampliamo l’analisi a giochi che hanno caratteristiche diverse rispetto agli scacchi e al Go. Ad esempio giochi nei quali l’informazione non è completa (poker) e dove esiste la casualità (backgammon e poker).
Sul “fattore caso” dobbiamo però fare una premessa. La casualità generata dai computer non è mai completamente… casuale. Può suonare strano, ma è così. La questione è molto matematica e anche un po’ filosofica. A chi volesse approfondirla consigliamo la lettura di un articolo raggiungibile da qui.
In sostanza il generatore di random di un computer è in grado di produrre sequenze di numeri pseudocasuali. Magari lunghissime e quindi vicine alla causalità come la intendiamo noi umani, ma di fatto non sono “completamente” casuali.
D’altra parte, se noi fossimo in grado di conoscere in anticipo tutte le condizioni che incideranno sul lancio di una moneta (forza, agenti atmosferici etc…) potremmo sapere in anticipo se uscirà testa o croce e quindi ripetere all’infinito il risultato. Ma non siamo in grado e quindi per noi quel lancio avrà un esito casuale. Il computer invece conosce le condizioni grazie all’algoritmo interno che produce la random. Albert Einstein ha detto “Dio non gioca a dadi“. Lo stesso vale per i computer.
Perché tutto questo preambolo? La ragione è che, soprattutto nel caso del backgammon, i software di gioco dispongono di un proprio Pseudo Random Number Generator sul quale ha imparato a giocare la rete neurale. Le due cose, in parte, confliggono.
BACKGAMMON
Cominciamo col dire che il backgammon è un gioco a informazione quasi completa. Tutti gli elementi della partita sono disponibili per i giocatori (posizione delle pedine, punteggio, valore del dado del raddoppio) ad eccezione del prossimo tiro di dadi. Le combinazioni di due dadi a 6 facce sono però limitate: 36. In questo senso il computer offre le mosse migliori per ciascuna di quelle combinazioni. E’ in grado di farlo grazie ad un sistema di rollout interno, cioè di svolgimento della partita, e al suo learning process. Il risultato è tuttavia attendibile entro un margine ridotto di mosse (3/4) successive al tiro che viene analizzato, almeno per le potenzialità dei programmi in commercio oggi.
I primi software per giocare a backgammon contro un computer, quali ad esempio Jellyfish e Snowhite, risalgono agli anni ’90. Trent’anni dopo si può parlare di un miglioramento, ma non tale da far dire che i software dedicati al backgammon abbiano “risolto il gioco”. Oggi il più famoso e utilizzato è eXtreme Gammon (purtroppo non disponibile per Mac/iPhone), seguito da GNU Backgammon e BGBlitz.
Questi programmi sono avversari competitivi per qualsiasi giocatore, anche di alto livello, ma dire che nel backgammon il computer sia nettamente superiore all’uomo sarebbe un’esagerazione. In futuro, forse, se ci sarà qualcuno intenzionato ad investire in reti neurali più avanzate. Per ora la sfida uomo-macchina a backgammon, a nostro avviso, è un pareggio.
I software in questo campo sono comunque un ottimo sistema di allenamento. L’ideale, per i motivi indicati in precedenza, è non utilizzare la random interna del computer ma un tiro di dadi “casuale”: quasi tutti i programmi accettano che sia l’uomo ad inserire la combinazione da analizzare.
C’è infine un altro elemento che i software di backgammon non possono valutare: quello del rischio connesso alla posta in palio. Un aspetto psicologico che il poker esalta ancora di più.
POKER
Nel poker, oltre all’aleatorietà, alcune informazioni sono nascoste. Parliamo infatti di un gioco ad informazione incompleta, perché non conosciamo le hole cards dei nostri avversari. La partita ruota soprattutto sulla capacità di lettura della mano altrui e di mistificazione della propria.
Le qualità necessarie per essere un buon giocatore di poker sono di tipo analitico-matematico da un lato e psicologico dall’altro. Quest’ultimo dipende in buona parte anche dalla posta in palio, senza la quale il rischio connesso a provare un bluff o a fare un hero call perde senso.
Questo rende il poker un terreno di sfida per i ricercatori, che per molto tempo hanno cercato di creare un programma capace di competere o persino battere un giocatore in carne ed ossa.
La ricerca è iniziato negli anni ’60, quando lo scienziato Nicolas Findler cominciò a sviluppare programmi che giocavano a poker, pubblicando le sue scoperte. L’idea fu trasformata in film. In Silent Running del 1972 c’è una scena in cui un membro di una nave spaziale programma due “droni” o robot per giocare a poker (il “classico” five-card draw) con lui. Dopo aver insegnato loro le regole del gioco, l’uomo sfida i droni in un paio di mani. Ad un certo punto del film, uno dei robot vince un piatto: l’uomo ride entusiasta di fronte al fatto che il robot fosse riuscito davvero ad imitare e forse superare l’intelligenza umana.
Più avanti, negli anni 80, Mike Caro usò un computer Apple II per creare un programma che potesse giocare a fixed-limit Texas Hold’em, e successivamente anche a no-limit hold’em. ORAC (questo il nome del programma, cioè “Caro” al contrario) ottenne parecchia attenzione quando alle WSOP affrontò i due ex vincitori del Main Event, Tom McEvoy e Doyle Brunson. Un altro match tra ORAC e Bob Stupak fu trasmesso in tv su Ripley’s Believe It or Not.
Molti ricercatori universitari da allora hanno continuato il lavoro. Nel 2007, durante il meeting annuale dell’Association for the Advancement of Artificial Intelligence a Vancouver (Canada), fu organizzata una sfida chiamata “First Man-Machine Poker Championship”. I poker pro Phil Laak e Ali Eslami giocarono contro un programma chiamato Polaris, sviluppato dai ricercatori dell’University of Alberta. Gli umani vinsero la partita a fixed-limit hold’em. Un anno dopo, la versione 2.0 di Polaris sfidò altri avversari umani e stavolta vinse. I ricercatori dell’Alberta continuarono il loro lavoro, creando un nuovo programma chiamato Cepheus. Il software era così efficace che il team di ricercatori proclamò “risolto” il gioco del limit hold’em heads-up. In realtà, la svolta verso una I.A. davvero competitiva doveva ancora arrivare.
E’ stato infatti necessario attendere il 2016 per assistere alla rivoluzione di Libratus, un computer in grado di battere nettamente gli umani. Realizzato da un gruppo di lavoro guidato da Tuomas Sandholm, professore di informatica alla Carnegie Mellon University, tra il 2016 e il 2017 Libratus sfidò un Team Human composto da quattro professionisti: Dong Kim, Jason Les, Jimmy Chou e Daniel McAulay. Questi 4 specialisti di heads-up online si cimentarono nella sfida definita Brains vs. AI 2. Al termine di 120.000 mani di cash game, il risultato non lasciò dubbi: un sonoro -1.766.000 dollari (virtuali, sia chiaro) subito dagli umani.
Il senso di frustrazione dei quattro pro player è pienamente espresso nella dichiarazione rilasciata poco dopo la sfida: “Se giochi contro un umano e perdi, puoi fermarti e fare una pausa. Qui invece abbiamo preso mazzate per 11 ore al giorno, tutti i giorni della sfida. Emotivamente è un’esperienza molto diversa, perché non sei abituato a perdere con questa frequenza“. (fonte Assopoker.com)
Ma qual è il segreto di Libratus? Di base, lo stesso di tutte le altre I.A. applicate al gioco, ovvero la possibilità di giocare un numero di mani (sull’ordine dei triliardi) impensabile per qualsiasi persona, di imparare dai propri errori e quindi di migliorarsi ad ogni successiva giocata.
Tutto questo non tanto per realizzare programmi che possano vincere a poker ma – come ha spiegato lo stesso professore di informatica – per sviluppare un’intelligenza artificiale in grado di ragionare in situazioni dove le informazioni disponibili sono parziali. Cioè, fare in modo che l’intelligenza artificiale sappia pensare e rispondere come un essere umano. Per Sandholm, Libratus potrebbe essere impiegato: “…in qualsiasi situazione in cui le informazioni sono incomplete, incluse negoziazioni negli affari, strategia militare, cyber sicurezza e trattamenti medici”.
Tutti scopi di primaria importanza, molto più rilevanti del gioco in sé. Ma volendo limitare il discorso al poker, l’esito della sfida dimostra – sempre secondo il responsabile del progetto Libratus – che “Le persone hanno l’idea che il poker sia un gioco molto umano e che i bot non sappiano per esempio bluffare. Ma si sbagliano di grosso: non si tratta di leggere l’avversario e cercare di capire se sta mentendo, perché tutto ruota attorno a carte e probabilità“.
Su questo qualche perplessità rimane, almeno nell’opinione di chi scrive. Nessun dubbio che la macchina sia in grado di valutare e analizzare una scelta dal punto di vista logico/matematico molto meglio di un essere umano. Ma quando quella scelta comporta un rischio, ad esempio di perdere denaro come nel caso del poker, la sfida tra I.A. e cervello umano diventa impari, perché la macchina non è in grado di provare la pressione psicologica legata alla paura di perdere (o non vincere) qualcosa.
E in questo senso potrebbe diventare poco utile all’uomo stesso. Vale per il poker ma, allargandosi un po’, potrebbe valere anche per ambiti ben più importanti. Questo pensiero ci riporta a un film di fanta-politica, cioè Wargames – Giochi di Guerra, la cui storia suscita un interrogativo: quando la situazione dovesse richiederlo, la macchina saprà valutare correttamente il rischio per l’uomo?
Un interrogativo inquietante ma che è materia per altre discussioni. O per un nuovo film di fantascienza.
Immagine di testa by Getty Images