Stupisce la continua metamorfosi di Google. Non conosce sosta, non mostra pietà, e sembra non avere limiti in termini di funzioni, e di ambiti, verso i quali si allarga. Assistiamo oggi agli effetti dell’ennesimo aggiornamento di quello che un tempo si chiamava Edge Rank, l’algoritmo di Google. Ed è un aggiornamento, il nome è BERT ed è un acronimo per Bidirectional Encoder Representations from Transformers, che muta alla radice il modo di funzionare del motore di ricerca. La notizia è di un mese fa o poco più; solo adesso si cominciano a osservare i primi effetti su 350 milioni di chiavi di ricerca, delle complessive 3.5 miliardi quotidiane. BERT lascia presagire scenari inediti, mutamenti profondi – non è solo una questione digitale – nella relazione tra i bisogni dell’uomo, la comprensione di questi bisogni e la loro realizzazione. Parole grosse? Direi di no.
Per un certo periodo Google è stato un motore di ricerca che forniva informazioni, comprese le notizie. In pochi anni si è trasformato nel prisma attraverso il quale accedere alla conoscenza del pianeta: ciò che non esiste su Google o non esiste, oppure è sinonimo di segretezza. Per un altro lungo periodo Google è, ed è stato, un motore cui porre interrogativi per ottenere risposte dirette; e quindi un motore di ricerca che utilizza le risorse del web per anticipare i desideri dell’utente senza passare per i siti. Per essere ancora più precisi: un’intelligenza artificiale che legge quello che trova scritto in una pagina, lo indicizza, lo gerarchizza, lo sintetizza e infine lo offre in pasto all’utente, senza bisogno che lo stesso utente legga quella pagina. Una ultra-disintermediazione. Già questo era un aggiornamento enorme: Google non svolgeva soltanto il ruolo di mediatore tra il bisogno di informazione delle persone e i contenuti, ma decideva quali contenuti meritavano – meritano – la lettura diretta da parte di un utente. Un vero motore di risposte.
Oggi si avvia a diventare un motore di ricerca che non solo fornisce informazioni e risposte, ma si spinge a capire fino in fondo le domande e orienta gli utenti – dentro lo stesso Google – rispetto alle azioni da fare, alla conclusioni da trarre. Un motore di ricerca che fa fare cose perché scardina alla radice il meccanismo (!) delle domande, e ne comprende sempre più il senso.
Partiamo dalla tecnologia che, come sempre, incarna madre natura per i ragazzi di Mountain View. Ricercarne l’energia, imbrigliarne la forza e orientarla al servizio degli utenti, calando questo sforzo in un racconto in cui l’intelligenza artificiale sia protagonista e serva a farci vivere meglio, rappresenta la mitopoiesi di qualunque loro azione.
Ancora una volta questo racconto poggia su due eroi che nel loro viaggio, dopo infinite traversie, ci riportano a casa: la tecnologia intesa come hardware, e la tecnologia intesa come software. «Per alimentare i propri servizi di ricerca e quelli a essi collegati – spiega Mark Malseed, in Google Story – Google fa girare programmi customizzati e brevettati su centinaia di migliaia di macchine costruite in house a seconda delle proprie esigenze», e visto che nella lingua inglese non esistono parole per definire una combinazione di hardware e software su scala tanto ampia e senza soluzione di continuità, alla fine l’hanno denominata Googleware.
Il primo eroe è la tecnologia nella sua componente ferrosa, di silicio.
BERT può funzionare perché Google ha prodotto nuovi processori, enormemente più potenti dei precedenti che si chiamano Cloud TPU v3 Pods, necessari perché altrimenti il software – chiamiamolo così – non avrebbe potuto girare. Si tratta di supercomputer, sviluppati appositamente per l’apprendimento automatico, che possono completare carichi di lavoro che prima richiedevano giorni o settimane, e oggi si possono fare in minuti, al massimo in qualche ora. Questi processori vanno a una velocità di 100Peta flop al secondo, cioè 100 milioni di miliardi di operazioni al secondo (spero i calcoli siano giusti).
Si tratta di un elemento essenziale in questa storia, ed è uno dei punti da ricordare quando si parla di Google: il software senza l’hardware non potrebbe nulla, e viceversa, eccolo il Googleware. Una capacità di sviluppare soluzioni e tecnologie che non ha eguali al mondo. Espressione di un predominio americano, californiano, per ora senza rivali.
Se la parte ferrosa, l’hardware, è il primo eroe di questa storia, il secondo è un nuovo software, utilizziamo questa espressione per capirci.
In realtà è qualcosa di molto più complesso, si tratta di un modello di apprendimento, un’architettura di rete neurale così la definiscono, e potremmo rappresentarlo come un’intelligenza artificiale che impara cose in maniera inedita, più precisa, più veloce. Rompe tutti gli schemi con cui fin qui si è cercato di capire cosa significasse un testo e quindi – nel caso del motore di ricerca – una nostra domanda. BERT fa tutto meglio e molto in fretta in 3 campi di applicazione dell’intelligenza artificiale: la traduzione automatica, la generazione automatica (andrebbe chiamata scrittura) di testi e quindi la produzione di riassunti, la comprensione di altri testi e quindi di domande.
Si tratta di un processo ingegneristico mostruoso che ha richiesto anni di lavoro e di investimenti. Un numero enorme di articoli, anche scientifici, sono alla base di questa tecnologia che noi abbiamo appena cominciato ad utilizzare.
Provando ad abbozzare una spiegazione, possiamo dire che BERT smette di prendere in esame le singole parole di una stringa di ricerca una alla volta, ma le pesa e le processa in relazione al complesso delle parole che compongono una frase, quelle successive e quelle che la precedono. E grazie a questo modo di procedere – bidirezionale – è come se arrivasse a comprendere il contesto in cui si sviluppa una domanda. E quindi a comprendere meglio la domanda in sé. Ancora una volta l’elemento numerico risulta essenziale: a ogni parola si attribuisce un punteggio di considerazione (attention score) che aiuta a pesare una singola parola in confronto con le altre, più il peso di una parola è alto più significa che quella parola aiuterà a far comprendere il senso della frase; e dunque delle espressioni più ambigue.
Facciamo un esempio, in una ricerca in cui compaiono macchina e Panda, la parola macchina avrà un punteggio elevato perché aiuta a rendere meno ambiguo il termine Panda, a non riferirlo quindi all’animale.
Per spiegare questo meccanismo, il blog di Google si serve di un titolo eloquente, per chi ha un minimo di familiarità con il modo di esprimersi degli informatici: cracking your queries. Che andrebbe tradotto con: scardinare, rompere pezzo pezzo, spaccare, le tue domande. Entrarci dentro, scassinarle e prendere quel che c’è da prendere.
Il cracking è quella cosa che si fa quando si tolgono i meccanismi di sicurezza a un software per ottenere informazioni, per poter fare qualcosa che altrimenti non sarebbe concesso; ad esempio per copiarlo. Dalle parti di Google stanno cercando di smontare le domande dell’umanità, attribuendo a ogni nostra parola un punteggio che aiuti a capire come funzionano quelle stesse domande da dentro, e per estrarne – infine – l’intento di ricerca che è il vero Graal di chi fa il loro mestiere.
Prima di BERT se un utente scriveva “2019 brazil traveler to usa need a visa”, quindi una ricerca su un turista brasiliano che nel 2019 vuole andare negli Stati Uniti e ha bisogno del visto, veniva interpretata come una ricerca di informazioni. E infatti Google restituiva un link del Washington Post con una notizia sul fatto che i brasiliani potevano andare negli USA senza un particolare visto. Adesso BERT offre come primo risultato il sito del dell’ambasciata americana in Brasile, in cui adempiere le formalità per andare negli Stati Uniti.
Altri esempi, una domanda del tipo “do estheticians stand a lot at work” prima veniva mal interpretata, nel senso che il motore di ricerca proponeva risultati, guardando alla professione di estetista e ai guadagni che ne derivavano, per il fatto di essere lavoratori autonomi (cattiva comprensione del verbo stand confuso con stand-alone). In realtà la richiesta era più semplice e diretta: le persone volevano capire quante ore un’estetista sta in piedi. Infine, Google interpretava – male – una ricerca come “can you get medicine for someone pharmacy”, pensando che l’utente stesse chiedendo come riempire una ricetta, o ottenere una ricetta pre-compilata; laddove la persona – probabilmente – cercava di capire come farsi aiutare dal farmacista a compilare una ricetta per un familiare o un amico.
Si tratta di un sistema al quale Google lavorava da tempo per cercare di interpretare in maniera più efficace il linguaggio naturale: il modo in cui le persone parlano, e quindi le ricerche conversazionali, come le chiamano con un’espressione agghiacciante gli esperti del settore. E questo vale sia per il motore di ricerca che per i servizi di traduzione (avrete notato quanto sia migliorato Google Translate nell’ultimo anno). Quanto Google impara in una lingua può essere trasferito in un’altra.
Ovviamente l’algoritmo del motore di ricerca è segreto. Ma la libreria, il codice di BERT è aperto. Chiunque può utilizzare questa architettura di rete neurale per addestrare la propria intelligenza artificiale, condividendone problemi e successi, indicando ciò che c’è da migliorare. Come sempre a Mountain View giocano con il pendolo che oscilla tra la segretezza assoluta e l’accesso libero ad alcuni codici, a seconda di quello che gli conviene. L’intelligenza collettiva, di cui parlava Pierre Levy, rappresenta uno strumento nelle mani di chi sa utilizzarla per migliorare la propria intelligenza artificiale.
E, grazie a tutto questo, compreso il nostro continuo apporto, l’intelligenza artificiale di Google sta facendo enormi passi avanti per capire come diciamo le cose, come ci esprimiamo, quali sfumature nella lingua servono a indicare cosa ci serve, di cosa abbiamo bisogno. Soprattutto in tutte quelle ricerche in cui la domanda è sempre più lunga e articolata, come se – parlando a Google – stessimo tentando di spiegare a un amico, cercando e soppesando le parole, una cosa di cui abbiamo bisogno. Non a caso ci invitano a essere più naturali nelle nostre ricerche per osservare come la magia di BERT restituirà risultati sempre migliori. Parlateci, chiedeteci – ci dice Google – e fatelo in libertà, «search in a way that feels natural for you», cerca nella maniera più naturale possibile.
L’avversario nascosto dei due eroi di tutta questa storia, sono le decine di migliaia di operatori umani (si chiamano quality rater) che aiutano Google a fare il proprio mestiere. Ragazzi che integrano e correggono – tentano di correggere – i risultati delle macchine. Sono avversari nella storia perché incrinano il mito di una tecnologia che risolve e allevia i problemi del mondo.
Ma proviamo a immaginare quali possano essere gli effetti profondi dell’introduzione di BERT e del suo sviluppo.
Dal punto di vista del funzionamento del motore di ricerca, tutto questo significa – lo dicevamo in apertura – che le domande che non prevedono risposte con nozioni o informazioni, ma richiedono azioni, da adesso in poi, saranno privilegiate nei risultati. E il potere di Google nel commercio crescerà in maniera mostruosa. Alla domanda su come acquistare un oggetto, Google proporrà una soluzione per acquistarla, e in breve questa diventerà “la” soluzione. Vale nel commercio come in molti altri settori, si pensi alla sanità. Alla domanda “dove curare un certo tipo di tumore”, potrebbe apparire in prima posizione non più il centro con il miglior indice di esito per quel tumore, ma quello che consente le prenotazioni online in maniera più facile.
Dal punto di vista degli utenti, la – presunta – maggiore efficacia nella comprensione delle nostre domande, ipoteca l’efficacia delle risposte. Se pensi di intuire il senso di cosa ti sto chiedendo, significa che la risposta che ti darò sarà una risposta presuntuosa, che ne esclude – per principio – molte altre. Cosa che Google ha cominciato a fare da quando ha riempito le sue pagine di risposta con snippet, quei rettangoli di sintesi dove si dirige subito il nostro sguardo e che catturano la nostra attenzione. Escludendo tutto il resto, precludendo alternative. Determinando il suo potere assoluto sul meccanismo di intermediazione di conoscenza del pianeta.
Dal punto di vista del futuro dell’intelligenza artificiale, BERT rappresenta una delle tante tappe importanti del processo che conduce verso l’intelligenza artificiale generale. Che una macchina capisca il contesto di una domanda potrà sembrarvi facile, scontato, ma non lo è affatto. Possiamo ipotizzare che BERT sia uno degli ultimi importanti esempi di intelligenza artificiale «debole, la varietà dedicata a fornire ausili al pensiero umano» prima della cosiddetta «AI forte, la varietà che cerca di automatizzare l’intelligenza di livello umano», come le definisce Nick Bostrom in Superintelligenza.
Dal punto di vista della concorrenza, ancora una volta Mountain View mostra agli altri attori di questo settore uno stato di avanzamento della tecnologi impressionante. Si tratta di una specie di avvertimento ai competitor, soprattutto quelli cinesi. E probabilmente anche al governo degli Stati Uniti, in considerazione delle ipotesi di smembramento di Google. Il messaggio potrebbe esseree: siete sicuri che volete fare uno spezzatino e indebolire un’azienda che è arrivata a questo punto?
Dal punto di vista politico, l’accelerazione nella comprensione e nella produzione di testi, significa che, prima o poi, un’intelligenza artificiale potrà scrivere contenuti malevoli in maniera automatica, con maggiore velocità e facilità di quanto non accada oggi, potrà impersonare un’altra persona (imitandone lo stile di scrittura, ad esempio). Lo spiega con chiarezza il blog di OpenAI, un laboratorio di ricerca di San Francisco, che ha come obiettivo quello di «garantire che l’intelligenza artificiale sia di beneficio a tutta l’umanità».
Dal punto di vista del potere seduttivo che Google esprime, il modo in cui racconta l’ennesimo aggiornamento dell’algoritmo e ciò che chiede all’essere umano sono aspetti che confermano il desiderio del motore di ricerca di farsi considerare un soggetto centrale nelle nostre esistenze. Un soggetto prossimo, amichevole, che ci aiuta a vivere meglio, cui donare la nostra naturalezza. Cui continuare a offrire quel 15% di domande inedite che ogni anno poniamo all’intelligenza artificiale. Un interlocutore con cui chiarirci. Un soggetto cui porre interrogativi sempre più articolati e complessi, nella speranza di ottenere risposte soddisfacenti, e nella certezza che questi interrogativi hanno un valore incommensurabile per Google, per noi pare di no.
Così come la vita è piena di malintesi, allo stesso modo la lingua risulta colma di fraintendimenti. E per fortuna, dovremmo aggiungere. Non esiste in natura la chiarezza totale, figuriamoci quella delle parole o degli interrogativi: con onestà ci tocca ammettere che abitiamo per tutta la vita una tensione a una maggiore limpidezza nell’esprimerci, quasi sempre senza riuscirci. Eppure i ragazzi di Mountain View hanno deciso di appianare i malintesi, limare i fraintendimenti, raschiare l’incertezza dall’orizzonte delle nostre ricerche, e condurci a destinazione in uno spazio, in cui tutto è limpido: domande e risposte. Una nitidezza efficiente, fastidiosa, splendente, avvolge il motore di ricerca che si preoccupa di capire cosa cerchiamo davvero e cosa meritiamo davvero di sapere e di fare. Di fronte all’enorme capacità dell’essere umano di essere oscuro, anche di fronte a se stesso, Google offre un modello che aiuta e semplifica. E fa impressione osservare quanta dedizione, quanto studio e ricerca, quante analisi, tempo, risorse economiche e quanta complessità siano stati necessari a produrre un risultato – importante e tuttavia provvisorio – di questo tipo, di necessaria semplificazione. Il timore, siamo di fronte a una strada senza ritorno, è che Google ce la farà a capire fino in fondo il senso delle nostre domande, malgrado noi stessi. A quel punto essere oracolo non sarà più una metafora, ma realtà.
Ps. Noto anche in questa vicenda una cosa che dico da tempo: i giornali dovrebbero applicarsi con costanza a quello che accade dentro Alphabet, Facebook o Amazon. Un post dei loro blog aziendali spesso può avere effetti enormi sulla vita delle persone e delle aziende, più di quanti non ne abbia la manovra economica in via di approvazione. Continuare a occuparci della Silicon Valley una volta come Lampada di Aladino che sforna soluzioni immaginifiche per le nostre esistenze, un’altra come una banda di 40 ladroni che compiono scorrerie nei territori della privacy, è un modo pigro di raccontare e spiegare le cose. E non sforzarsi di cogliere – prima di tutto – la cultura di quel magnete socio-economico che è la Silicon Valley rappresenta un errore enorme.