Staipa’s Blog

Il Blog di Stefano Giolo

Google e Apple ci ascoltano? No. Ma forse il tuo smartphone sì.

Sono in molti ad aver provato questa strana sensazione: hai parlato con un amico di qualcosa, non lo hai cercato su internet, non lo hai cercato su Amazon, non lo hai scritto su Facebook, ma improvvisamente ti arrivano notizie o pubblicità sull’argomento.
A me è successo con Chuck. Stavo riguardando la serie tv, non ho cercato nessuna notizia a riguardo ma improvvisamente mi sono arrivate notizie dell’attore Zachary Levi che sognerebbe di rimettere in piedi una nuova stagione o un film a distanza di anni. Possibile?
Sono convinto che un modo per realizzare una simile comunicazione mirata attraverso il microfono del mio smartphone ci sia, ma che non sia quello che le persone si aspettano.

Tanto per cominciare, Google e Apple ci ascoltano?

La risposta più probabile è no. Se non bastasse l’ovvia constatazione che se ci fosse un continuo flusso di audio dal nostro telefono ai loro server qualcuno se ne sarebbe accorto, soprattutto noi utenti che teniamo controllata la quantità di giga che abbiamo pagato all’operatore telefonico, gli specialisti di Wandera hanno fatto un apposito studio. Wandera è una società privata che sviluppa soluzioni di sicurezza cloud. Hanno preso un telefono Android e uno iOs e li hanno chiusi in una stanza insonorizzata riproducendo al suo interno per mezzora audio di pubblicità di cani e di gatti. Poi hanno preso un’altra coppia di telefoni, uno Android e uno iOs e li hanno messi in una analoga stanza insonorizzata questa volta senza riprodurre alcun suono.
Su tutti e quattro i telefoni erano installate le app Facebook, Instagram, Chrome, SnapChat, Youtube e Amazon. Hanno poi usato tutti e quattro i telefoni per navigare in Internet e cercare informazioni riguardo agli animali e non hanno rilevato alcuna differenza nei risultati.
Hanno fatto poi un secondo test attivando Siri e Google Now, gli assistenti vocali, e usandoli massivamente per valutare il consumo di dati in caso di invio continuo delle comunicazioni vocali ai server di Google e Android per confrontare il consumo di dati rispetto a quando erano nelle stanze insonorizzate con i loop pubblicitari.
Ecco i risultati in grafico:

MB consumati in 30 minuti con iOs durante i test
MB consumati in 30 minuti con Android durante i test

Per iOs l’assistente vocale Siri ha consumato 18 megabyte inviando la registrazione audio dei comandi dell’utente rispetto al ben meno di 1 megabyte per tutte le altre applicazioni, per Android il consumo è stato di 60 Mega byte con l’uso dell’assistente vocale OK Google rispetto a quantità trascurabili di consumo rispetto alle altre applicazioni. La differenza tra i 60 MegaByte di Android e i 18 di Siri probabilmente dipendono da una differenza di qualità dell’audio inviato o della compressione utilizzata o dai comandi e le risposte trasmesse ed è in ogni caso non comparabile tra i due sistemi.
Questo test sembrerebbe dimostrare con chiarezza che Apple e Google non ascoltano le nostre conversazioni se non interpellati attraverso i loro assistenti vocali. Studi analoghi sono stati fatti per quanto riguarda Alexa di Amazon e comunque ognuno di noi può verificare controllando il proprio router wifi il consumo di dati.
Questione chiusa? No. Restano aperte due questioni, la prima è: quindi non possono ascoltare le nostre conversazioni? La seconda è ma quindi come fanno a sapere che ho parlato di un dato argomento?

Ma quindi non possono ascoltare le nostre conversazioni?

In realtà possono e l’hanno fatto. In primo luogo molte conversazioni vengono comunque inviate. Ad esempio se sono accanto al mio telefono o al mio dispositivo questo potrebbe captare un comando che riconosce simile ad “Ok Google” o “Hey Siri”, o “Alexa blablabla” e inviare frasi e parti di audio ai server. Sta a voi poi decidere se questo piaccia o no, ma è un dato di fatto che ci siano stati diversi scandali a riguardo all’ascolto da parte di dipendenti di alcune aziende, ecco alcuni esempi:

Non hanno a che fare con il tema dello studio della profilazione dei nostri interessi, in tutti i casi l’ascolto era limitato alle comunicazioni inviate attraverso l’assistente vocale, volontariamente o per attivazione involontaria. Ma di fatto i casi ci sono stati.

Ma quindi come fanno a sapere che ho parlato di un dato argomento?

Ci sono molte opzioni a disposizione di chi controlla milioni di smartphone e la gran parte non richiede necessariamente ascoltare e processare migliaia di TeraByte di audio al giorno. Avendo a disposizione per esempio la posizione GPS si può sapere se la persona frequenta determinati ambienti, palestre, teatri, cinema, supermercati, locali per scambisti, pub, asili nido, musei…
Se un profilo già conosciuto come appassionato di qualcosa sta spesso vicino ad un’altra persona è probabile che il giudizio di quest’ultima possa essere influenzato, ad esempio perché non proporre un abbonamento alla palestra a qualcuno che incontra spesso degli sportivi?
Per la realizzazione del profiling invece è sufficiente avere accesso alle ricerche e i siti visitati dallo smartphone, per non parlare del fatto che la gran parte dei siti contiene banner pubblicitari che sono venduti spesso dalle stesse aziende che costruiscono questi profili e sono usati oltre che per veicolare pubblicità anche per raccogliere dati. Anche i like sui social network sono molto utili per conoscere gli interessi di una persona, ovviamente.
Qualche esempio pratico che puoi verificare da te:

Google

Facebook

Apple

Per tutti c’è una quantità di dati più che sufficienti per conoscere ogni utente meglio di come lo conoscerebbe il partner, o il miglior amico, quindi non è necessario ascoltare ogni conversazione per poter puntare con una buona dose di sicurezza a fare una buona pubblicità mirata.

Un’altra possibilità è il caso. Può succedere che tra tutte le cose che diciamo è tutta la pubblicità che riceviamo possano esserci delle coincidenze, e abbiamo la tendenza la naturale a pensare che le coincidenze non siano date dal caso.

Ma allora il fatto che gli smartphone ci ascoltino è una bufala?

Nessuno lo sa con certezza, in quanto i protocolli e il software che eventualmente si occupa di questo non è opensource, solo Apple, Google, e a questo punto aggiungiamo Amazon possono sapere come funzionano. Secondo quanto abbiamo visto l’unica cosa certa è che le nostre conversazioni non vengono fisicamente inviate ai loro server. Ma questo davvero garantisce che non vengano ascoltati? Esistono svariati modi per raccogliere dati, e questo lo abbiamo visto nella parte precedente dell’articolo. Molti di questi a un non informatico probabilmente non verrebbero mai in mente, siamo sicuri che non ci sia qualche sistema che invece verrebbe in mente a un informatico per captare informazioni dalle conversazioni al microfono?
Se io dovessi farlo prenderei il sistema di profilazione usato in tutte le altre pubblicità mirate e chiederei agli insertori pubblicitari paganti il tipo di target che stimano di poter interessare, poi mi comporterei così:

Prendiamo l’esempio accaduto a me sulla serie tv Chuck che stavo guardando. I produttori di Chuck vogliono sondare il mercato per la possibilità di realizzare una nuova stagione. Come fanno a fare lo studio senza chiamare a casa persone e mettere in giro rumors?
Una serie tv come Chuck ha un target abbastanza prevedibile: è una serie piuttosto Nerd andata in onda tra il 2007 e il 2012, è prevedibile che il suo pubblico avesse tra i 20 e i 30 anni all’epoca e che ora abbia tra i 33 e i 43 anni, chiunque al di sotto di tale soglia probabilmente non ne ha mai sentito parlare, chiunque al di sopra pure. I fan più accaniti probabilmente sono anche appassionati di informatica e di serie tv, non è difficile attraverso il profiling digitale sapere anche chi in questa fascia abbia cercato in passato informazioni sulla serie o sugli attori della serie.

Lo smartphone è già configurato per riconoscere i comandi “Ok Google” o “Hey Siri” per tanto è pronto ad ascoltare con il microfono ulteriori comandi. Basterebbe inviargli una lista di altri comandi a cui reagire. Da qui in poi li chiameremo semini. Una volta installati i semini Chuck, Zachary Levi e Yvonne Strahovski, sugli smartphone di chi corrisponde al profilo, i loro smartphone potrebbero reagire se il proprietario nomina uno di questi.

Nel frattempo gli attori principali vengono invitati a fare tweet e messaggi sibillini sulla possibilità di una nuova stagione o di un film.

Gli appartenenti al target di persone che hanno ricevuto il semino sul loro telefono se leggeranno di questi rumors, nomineranno Chuck, Zachary Levi, Yvonne Strahovski, e il telefono riconoscendo tali parole come comandi al pari di “Ok Google” o “Hey Siri” non avrà necessità di inviare una conversazione ai server ma solo una comunicazione minuscola per dire che un utente appartenente al target ha parlato dell’argomento. Rendendo il fornitore in grado di sapere che tu sei interessato e che può mandarti pubblicità su quel tema. Lo stesso ovviamente può valere anche senza un input iniziale da parte dei rumors.
Io per esempio metterei il semino “calvizie” a tutti i maschi intorno ai trent’anni, e manderei a quelli che lo attivano pubblicità su lozioni contro la perdita di capelli, il semino “gravidanza” a tutte le coppie sposate sotto i 35 anni per mandare a chi ne parla pubblicità di materiali per l’infanzia, ma sono sicuro che un pubblicitario troverebbe degli abbinamenti ben più appropriati dei miei.

Quanti semini potrebbero installare su un telefono?

Un megabyte, che sappiamo essere qualcosa che possiamo definire “poco“, contiene un milione di byte, quindi ci si possono codificare un milione di caratteri.

La Divina Commedia di Dante Alighieri che in termini di dimensioni possiamo definire “tantissimo” è composta da circa 408.476 caratteri, quindi ci sta in poco meno di mezzo megabyte, e contiene 101.698 parole.

Facendo una facile proporzione con solo un megabyte e considerando una parola di lunghezza media sui dieci caratteri (in Italiano la media si attesta intorno ai 5,7), si potrebbero inviare qualcosa come 100.000 semini (90.909 se aggiungiamo un carattere divisiorio).

Immagino che se io ho avuto questa idea da solo, Apple, Google e Amazon abbiano i mezzi per ingegnerizzare un sistema ben più complesso di quello ideato da me, e sarebbe poco intelligente non averlo sviluppato.

Fonti:
Is your phone always listening to you? di Wandera (https://www.wandera.com/phone-listening/)
Analisi statistica della Divina Commedia di Edizioni XII (https://tinyurl.com/ya5e5hoz)

Disclaimer

Tutto ciò che leggi qui dentro è una libera rielaborazioni di vissuti, sogni e immaginati. Non rispecchia necessariamente la mia realtà. Se chi legge presume di interpretare la mia vera persona sbaglia. Se chi legge presume che tutto sia inventato sbaglia parimenti. Se tu che leggi mi conosci, leggimi come leggeresti uno scrittore sconosciuto e non chiederti altro di diverso di ciò che chiederesti di questo.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Scroll Up

Questo sito usa cookies per fornirti la migliore esperienza. Se sei d'accordo clicca sul tasto 'Accetta cookies', altrimenti controlla la privacy cookies policy e scegli nel dettaglio.

Impostazioni Cookie

Di seguito puoi scegliere quale tipo di cookie consentire su questo sito Web. Fai clic sul pulsante "Salva impostazioni cookie" per applicare la tua scelta.

FunctionalOur website uses functional cookies. These cookies are necessary to let our website work.

AnalyticalOur website uses analytical cookies to make it possible to analyze our website and optimize for the purpose of a.o. the usability.

Social mediaOur website places social media cookies to show you 3rd party content like YouTube and FaceBook. These cookies may track your personal data.

AdvertisingOur website places advertising cookies to show you 3rd party advertisements based on your interests. These cookies may track your personal data.

OtherOur website places 3rd party cookies from other 3rd party services which aren't Analytical, Social media or Advertising.