MOTORI RICERCA

L'algoritmo TF-IDF: introduzione alla semantica

May 31 2017
Scheda utente
Altri testi utente
RSS utente

La ricerca semantica è un concetto che ha assunto un valore importante nella SEO già diversi anni fa: già, ma all'atto pratico, cosa significa ragionare con la semantica? Come lo fa Google? Introduciamo l'argomento con l'algoritmo TF-IDF.

Rilevanza, non keyword

La "vecchia" strategia di inserire le keyword di ricerca per le quali si intende posizionare una pagina all'interno di essa, in modo più o meno aggressivo e più o meno naturale, è superata da tempo. Questo probabilmente anche tu già lo sai... Ciò non significa dimenticarsi di settare correttamente titoli, snippet, h1 ecc... con le keyword corrette, ma sicuramente si traduce in una consistente perdita di efficacia di azioni quali la cura della cosiddetta "keyword density" o della formattazione di parti di testo all'interno del contenuto della pagina. Queste tecniche se vogliamo "artigianali" (che però molti SEO ancora applicano, a volte anche noi in casi particolari), lungi dall'essere ormai in disuso, sono però oggi ampiamente superate dalla ricerca semantica, aspetto sul quale sono ormai basati gli algoritmi di Google. In sostanza, il motore di ricerca non guarda più a "quante volte è presente la keyword digitata dall'utente" su una determinata pagina del suo database indicizzato, ma alla rilevanza che il suo contenuto ha rispetto alla query. Quanto esso è inerente alla ricerca. Uno degli algoritmi utilizzati a tal fine è definito con la sigla TF-IDF.

Cos'è il TF-IDF?

L'acronimo, ovviamente inglese, sta per "term frequency-inverse document frequency", ma il suo significato è molto più semplice della sua definizione: fondamentalmente, è un algoritmo utilizzato per misurare l'importanza di una determinata keyword all'interno di una pagina. Diversamente da quanto avviene per la keyword density, o la formattazione del testo, esso non esamina soltanto il numero di volte in cui una determinata parola chiave è presente nel testo, nè se essa è in grassetto o in italico, ma analizza più pagine e cerca di determinare quanto questa o quella keyword siano effettivamente rilevanti. Provo a spiegarti con un esempio pratico: nell'ambito della riparazione auto, il termine "riparazione gomme" è ritenuto più importante rispetto a "riparazione turbine", semplicemente perchè ogni auto ha le gomme, ma solo una piccola parte di esse ha una turbina nel motore. In conseguenza di questo ragionamento, se vogliamo piuttosto immediato in questo caso, ma molto meno in altri settori, il termine "riparazione gomme" sarà ritenuto più rilevante in relazione all'argomento considerato, ovvero riparazione auto (che ipotizziamo possa essere la query dell'utente). Ecco quindi cosa fa l'algoritmo TF-IDF: basandosi sulle statistiche di utilizzo di determinati termini all'interno dei contesti analizzati, Google determina la rilevanza di una pagina, e dell'intero sito, in riferimento alla ricerca immessa.

Come adeguarsi?

Come sempre, i tool automatici vengono in aiuto ai SEO... in questo caso davvero non sarebbe possibile fare altrimenti. Da un lato, siamo tutti contenti (intendo noi SEO), perchè sta finendo l'era della "SEO fatta in casa" con pochi e semplici accorgimenti (che spesso portano al "keyword stuffing", ovvero all'utilizzo eccessivo di una keyword all'interno di un testo): dall'altro, l'argomento che stiamo trattando è solo un accenno al concetto di semantica, che presuppone tutta una serie di analisi preliminari che consentano di elaborare una strategia di posizionamento che potremmo definire, in modo semplicistico, alternativa. Sopratutto su settori e mercati estremamente competitivi, oggi trovare il modo di posizionarsi su terminologie e definizioni alternative, e concentrare quindi il copywriting su di esse, può davvero rivelarsi la strada vincente.
Ma torniamo al nostro TF-IDF: lavorare in risposta a questo algoritmo significa sostanzialmente conoscere quali sono le keyword ritenute più rilevanti in relazione alla query per la quale ti vuoi posizionare (esaminare i competitor meglio posizionati è solitamente il metodo più efficace), capire quali di esse possono essere utilizzate in modo naturale all'interno dei nostri contenuti e, infine, analizzare se abbiamo fatto un uso adeguato di determinati termini (e non in eccesso o difetto). Come dicevamo, un tool è in grado di automatizzare queste azioni, al fine di redarre un report che faccia da linea guida per chi dovrà scrivere i contenuti del tuo sito.

Ti stai chiedendo se ti tocca rivedere i testi del tuo sito? Beh, è molto probabile, ma ricorda di non ragionare mai in ottica strettamente SEO, perchè contenuti naturali, approfonditi e di buona qualità ed originalità rimangono uno degli aspetti più importanti non solo per il posizionamento, ma soprattutto per l'esperienza utente.



Licenza di distribuzione:
FONTE ARTICOLO
© Pensi che questo testo violi qualche norma sul copyright, contenga abusi di qualche tipo? Leggi come procedere