MOTORI RICERCA

Google ci legge nel pensiero? Prima parte

April 3 2017
Scheda utente
Altri testi utente
RSS utente

Più o meno… Ad oltre tre mesi dall’ultimo articolo del nostro blog, per farci perdonare oggi affrontiamo un argomento tanto importante quanto complesso: come google “traduce” le nostre richieste di ricerca. Divideremo l’argomento in due capitoli, cominciando dai concetti di associazione, pertinenza e contesto.

La richiesta di ricerca che Google elabora cerca di essere la migliore interpretazione delle intenzioni dell’utente. Per comprendere meglio questa affermazione, prova quanto segue: vai su Google e digita “primavera” sulla barra di ricerca. Vi è la possibilità che i primi risultati ottenuti siano incentrati sulla stagione che arriva a marzo. Alcuni dei risultati, invece, non menzionano la parola “primavera” (l’unica digitata sulla barra di ricerca). In qualche modo, Google sa che stai cercando una stagione, piuttosto che informazioni di carattere generale sull’equinozio, o il nome di una canzone, o un’altra cosa chiamata primavera, e dietro le quinte trasforma la richiesta di ricerca in qualcosa che possa rispondere, in ordine di probabilità, alla richiesta originale. Approfondiamo il funzionamento di questo processo e ciò che esso implica per la SEO.

Favorire associazioni e pertinenza

Recenti informazioni diffuse da Google offrono una comprensione maggiore su come il motore di ricerca affronta le situazioni di ricerca ambigue, troppo generiche o mancanti di contesto (come la ricerca di “primavera” sopra citata). Viene descritto il sistema di trasformazione della ricerca in una versione meglio formulata della stessa, cosicché Google possa fornire esattamente i risultati della ricerca che l’utente desidera. In sostanza, quando Google riceve una richiesta di ricerca ( query), andrà ad identificare e collegare documenti web da un indice associato alla query, sulla base della parola che l’utente ha digitato. Esaminerà quindi le pagine da lì estratte, i concetti, i cluster semantici ad essa riferiti: se si accorge che i risultati appartengono ad alcuni concetti molto diversi, probabilmente concluderà che la query è ambigua e potrebbe beneficiare di un perfezionamento.

Vediamo come tale processo s’innesca sull’esempio effettivo della parola “primavera”. Quando si digita “primavera”, Google andrà a raccogliere una serie di risultati di ricerca che corrispondono letteralmente alla query. Facciamo l’esempio che abbia trovato cento risultati; a ciascuno dei cento risultati verrà associato un punteggio per stimare la rilevanza della query originale (“primavera”), basato su fattori SEO. Quindi, Google andrà a identificare i temi, o cluster semantici ai quali queste pagine appartengono: per “primavera”, tali cluster possono essere “stagione di marzo”, “equinozio di primavera”, “pizza primavera” e altri cluster più piccoli. In qualche modo, Google comprende quali sono i concetti a cui si è interessati.

Il passaggio successivo è legato al database delle associazioni, luogo in cui sono memorizzate le query passate, le pagine web e le associazioni tra queste. Per ogni associazione, Google assegna un peso, calcolando una sorta di prodotto tra il grado di importanza della pagina e la frequenza della query, o volume di ricerca. Esaminerà quindi le ultime query associate a ciascuno dei risultati e il peso di queste associazioni. Le associazioni con il più alto punteggio provenienti a loro volta dai cluster con più alto punteggio saranno raccolte e candidate a dare origine alla query che possiamo definire “raffinata”.

Dal momento che, come abbiamo detto, il peso è la rilevanza moltiplicata per il volume di ricerca, si potrebbe comprendere il motivo per cui, in questo particolare momento dell’anno, la ricerca per “primavera” si trasforma in qualcosa come “la stagione che arriva con il mese di marzo”. Vale la pena notare che Google spesso prende più di un cluster o un argomento per affinare la query. Ciò è evidente quando i possibili gruppi associati alla parola chiave originale hanno pari o quasi uguale peso: in tal caso, a Google non resta che permettere all’utente di decidere quale argomento può interessare maggiormente.

La storia di ricerca e il contesto

C’è poi il ruolo del contesto nel perfezionare una ricerca dell’utente. Il contesto, in questo caso, è un insieme di parole e frasi associate a un singolo dominio. I contesti aiutano Google sia a indicizzare informazioni, sia ad agevolare gli utenti: in primis, infatti, divide l’universo delle informazioni in domini. Guardando a una pagina web e alle parole ed espressioni utilizzate all’interno di essa, Google può capire facilmente quale contesto attribuire alla pagina, basandosi sulle intersezioni tra le parole presenti in un certo contesto e il contenuto della pagina. Così, quando si guarda a una pagina che contiene termini come “Marzo”, “Equinozio” e “Stagione”, dedurrà “ah, il contesto di questa pagina è Primavera intesa come stagione”. Lato utente, invece, per determinare il contesto della ricerca, Google guarda le ricerche immediatamente precedenti a quella esaminata e, se necessario, va indietro anche di parecchio tempo, ricostruendo di fatto una sorta di “browsing history”. Se la cronologia delle ricerche indica che si è particolarmente interessati a “Pizza Primavera”, Google può a quel punto privilegiare il cluster “Pizza” quando si cerca “Primavera”, sulla base delle informazioni contestuali che ha appena acquisito.

Quindi, giusto per cambiare esempio, se cerchiamo “oscar”, in realtà ciò che stiamo dicendo al motore è: “cerca oscar, tendendo a mente tutto quello che sai di me, Google”.

Perfezionamento della query con ulteriori dati acquisiti

La ricerca e la cronologia del broswer non sono l’unico tipo di contesto che Google può utilizzare per affinare le ricerche. I suoi potenti algoritmi, infatti, possono addirittura interrogare eventuali informazioni relative ai gusti ed alle preferenze dell’utente, come ad esempio i film che ha visto o la musica che ha ascoltato. E, udite udite, anche essi possono essere utilizzati per perfezionare la query. Chiaro che si tratta di ricerche molto specifiche, ma se vi dicessi che se si cerca “black man” e il film Man in Black è attualmente in proiezione nella vostra zona, ciò potrebbe influenzare i risultati della ricerca? Già, Google può dare la preferenza al gruppo semantico che riguarda il film Man in Black, piuttosto che ad altri gruppi semantici associati alla query, perchè di fatto presume di conoscere il contesto nel quale vi trovate.

Quindi riassumendo: tentativo di associazione ad elementi indicizzati, associazione ad argomenti pertinenti, riferimento a cluster semantico, associazione a storia di ricerca e contesto, perfezionamento con ulteriori dati acquisiti. E non è ancora finita… nel prossimo capitolo parleremo di posizionamento, sinonimi, word2vec ed entità.



Licenza di distribuzione:
© Pensi che questo testo violi qualche norma sul copyright, contenga abusi di qualche tipo? Leggi come procedere