I FONDAMENTALI DEL DESIGN E DELLO SVILUPPO SEARCH ENGINE FRIENDLY

Google Panda

I motori di ricerca sono limitati nei modi in cui possono esplorare la rete e interpretare i contenuti.

Una pagina web appare a te e a me in maniera diversa da come appare ad un motore di ricerca. In questa sezione, ci concentreremo sugli aspetti tecnici specifici della costruzione (o modifica) di una pagina web in modo da renderla ben strutturata, sia per un motore di ricerca sia per un visitatore umano. Questa è una parte della guida che ti consigliamo di condividere con i tuoi programmatori, progettisti informatici e designer, così che tutte coloro che sono coinvolti nella realizzazione di un sito possano pianificarlo e svilupparlo in modo adatto alle esigenze di un motore di ricerca.

CONTENUTI INDICIZZABILI

Per poter essere elencati nei motori di ricerca, i tuoi contenuti più importanti devono essere in formato testuale HTML. Nonostante i progressi nelle tecnologie di crawling, immagini, file Flash, applet Java, e altri contenuti non testuali sono spesso ignorati o svalutati dagli spider dei motori di ricerca. Il modo più facile per assicurarsi che le parole e le frasi che mostri ai tuoi visitatori siano visibili ai motori di ricerca è quello di inserirli nel testo HTML della pagina. Sono tuttavia disponibili metodi più avanzati per coloro che hanno bisogno di una formattazione o di stili visivi più sofisticati:

  1. In HTML, alle immagini in formato gif, jpg o png possono essere assegnati degli "attributi alt", per fornire ai motori di ricerca una descrizione testuale del contenuto visivo.
  2. Alle barre di ricerca è possibile aggiungere dei link che i crawler potranno navigare ed esplorare.
  3. Contenuti inseriti in formato Flash o come plug-in Java possono essere integrati con l’aggiunta di testo sulla pagina.
  4. Contenuti audio e video dovrebbero essere accompagnati da una trascrizione testuale se si vuole che le parole e le frasi usate vengano indicizzate dai motori.

STRUTTURA DEI LINK ESPLORABILE DAI CRAWLER

Così come hanno bisogno di vedere i contenuti per poter registrare le pagine nei loro giganteschi indici basati su parole chiave, i motori di ricerca hanno anche bisogno di individuare i collegamenti per poter trovare i contenuti. Una struttura di link esplorabile dai crawler - che permetta ai loro spider di muoversi all'interno dei percorsi di un sito web - è fondamentale al fine di trovare tutte le pagine presenti su un sito. Centinaia di migliaia di siti commettono il madornale errore di strutturare la loro navigazione in modo tale da rendere impossibile l'accesso da parte dei motori di ricerca, andando ad intaccare la loro capacità di inserire le pagine nei propri indici.

Qui sotto abbiamo illustrato come può verificarsi questo problema:

Nell'esempio qui sopra, lo spider di Google ha raggiunto la pagina "A" e vede dei link alle pagine "B" ed "E". Tuttavia, anche se C e D potrebbero essere delle pagine importanti del sito, lo spider non ha modo di raggiungerle (o nemmeno di sapere della loro esistenza.) Questo perché non esiste alcun link diretto ed esplorabile che punti a quelle pagine. Dal punto di vista di Google, potrebbero anche non esistere - ottimi contenuti, un sistema mirato di parole chiave e un marketing intelligente non serviranno a nulla se, in primo luogo, gli spider non possono raggiungere quelle pagine.

REL=”NOFOLLOW”

Rel="nofollow" può essere utilizzato con la seguente sintassi:

<a href="http://dmware.com" rel="nofollow">Lousy Punks!</a>

Ai link si possono applicare tanti attribuiti, ma i motori li ignorano quasi tutti, con la notevole eccezione del tag rel="nofollow". Nell'esempio sopra, aggiungendo l'attributo rel=nofollow al tag del link, abbiamo detto ai motori di ricerca che noi, i proprietari del sito, non vogliamo che questo link venga interpretato come il normale "voto editoriale." Nofollow, preso alla lettera, dà istruzione ai motori di ricerca di non seguire un link (anche se alcuni lo fanno.) La tag nofollow fu introdotta come metodo per bloccare i commenti automatici nei blog, nei guest book e lo spam dovuto ai generatori di link (puoi leggere di più sulla sua introduzione qui), ma col tempo si è trasformato in un modo per dire ai motori di non dare ad un link quel valore che gli sarebbe stato altrimenti attribuito. I link contrassegnati con nofollow sono interpretati in maniera leggermente differente a seconda del motore, ma è chiaro che non hanno la stessa importanza dei normali link "seguiti".

I link nofollow sono deleteri?

Sebbene non possiedano lo stesso valore dei loro cugini “seguiti”, i link nofollow sono una componente naturale di un profilo di collegamenti variegato. Un sito con tanti link che portano ad esso accumulerà molti link nofollow, e non è una brutta cosa. Difatti, i Ranking Factors di Moz hanno dimostrato che i siti col posizionamento migliore tendono ad avere una percentuale più alta di link nofollow rispetto ai siti con un posizionamento peggiore.

UTILIZZO E TARGETING DELLE PAROLE CHIAVE

Le parole chiave sono fondamentali per la procedura di ricerca - sono i mattoni della lingua e della ricerca. In effetti, l'intera scienza del recupero di informazioni (inclusi i motori di ricerca basati sul web come Google) si fonda sulle parole chiave. Mano a mano che i motori esplorano e indicizzano i contenuti delle pagine sul web, registrano quelle pagine in indici basati su parole chiave. Così, piuttosto che immagazzinare 25 miliardi di pagine web in un unico database, i motori hanno milioni e milioni di database più piccoli, ognuno dedicato ad un particolare termine o frase chiave. Questo permette ai motori di recuperare i dati di cui hanno bisogno molto rapidamente.

Naturalmente, se vuoi che la tua pagina abbia una possibilità di essere posizionata nei risultati di ricerca per il termine "cane", sarebbe bene che ti assicurassi che la parola "cane" faccia parte dei contenuti indicizzabili del tuo documento.

IL DOMINIO DELLE PAROLE CHIAVE

Le parole chiave dominano i nostri intenti di ricerca e le nostre interazioni con i motori. Per esempio, un comune modello di ricerca potrebbe essere più o meno così:

Quando si avvia una ricerca, il motore confronta le parole inserite nella barra di ricerca con quelle contenute nelle pagine che deve individuare. Altri dati, come l'ordine delle parole, l'ortografia, la punteggiatura, e l'uso di maiuscole forniscono informazioni aggiuntive che i motori usano per riuscire a recuperare le pagine giuste e posizionarle.

Per svolgere questo compito, i motori di ricerca analizzano il modo in cui le parole chiave sono usate nelle pagine per determinare la "pertinenza" di un particolare documento in relazione ad una determinata ricerca. Uno dei modi migliori per "ottimizzare" il posizionamento di una pagina è quello assicurarsi che le parole chiave siano bene in mostra nei titoli, nel testo e nei metadati.

Generalmente, più specifiche sono le parole chiave, migliori sono le possibilità di venire posizionati senza doversela vedere con una forte concorrenza. Il grafico a sinistra mostra la pertinenza del termine generico “libri” rispetto al titolo specifico, “Tale of Two Cities”. Si noti che, mentre ci sono molti risultati (dimensione del Paese) per il termine più generico, ci sono molti meno risultati, e quindi concorrenza, per il risultato più specifico.

I TITLE TAG

L'elemento title tag di una pagina deve costituire una descrizione accurata e concisa dei suoi contenuti. È fondamentale tanto per l'esperienza dell'utente quanto ai fini dell'ottimizzazione per motori di ricerca.

Poiché i title tag sono una parte davvero importante dell'ottimizzazione per i motori di ricerca, adottare i suggerimenti che descriviamo di seguito, costituisce un modo fantastico per ottenere grandi risultati in termini di SEO con un minimo sforzo.

I suggerimenti che seguono riguardano gli aspetti più importanti dell'ottimizzazione dei title tag per migliorare l’usabilità e aumentare la compatibilità con i motori.

Attenzione alla lunghezza

I motori di ricerca mostrano solo i primi 65-75 caratteri di un title tag nei risultati di ricerca. (Superata questa lunghezza, i motori mostrano dei puntini di sospensione - "..." per indicare in che punto un title tag è stato interrotto). Questa lunghezza corrisponde anche al limite massimo solitamente ammesso dalla maggior parte dei social media, quindi, come regola generale, è bene mantenersene al di sotto. Tuttavia, se tu volessi puntare a più parole chiave (o a una frase chiave particolarmente lunga) e se mostrarle nel title tag fosse essenziale per il posizionamento, potrebbe essere opportuno aumentarne la lunghezza.

Colloca le parole chiave importanti vicino all'inizio

Più le parole chiave sono vicine all'inizio del title tag, più utili saranno per il posizionamento e più facile sarà che un utente possa cliccare su di loro nella pagina dei risultati di ricerca.

Sfrutta il branding

Ci piace molto terminare ogni title tag con il nome di un marchio, perché così facendo si aumenta la sensibilizzazione al brand e si sviluppa un tasso di clic-through grazie alle persone cui il brand piace o che lo trovano familiare. A volte conviene piazzare il nome del proprio marchio all'inizio del title tag, per esempio nella propria homepage. Dal momento che le parole all'inizio del title tag hanno più peso, è importante aver ben chiaro in mente per quali termini si desidera essere posizionati.

Tieni presente la leggibilità e l'impatto emotivo

I title tag dovrebbero essere leggibili e descrittivi. Creare un title tag accattivante porterà più visite provenienti dai risultati di ricerca e può contribuire a far affezionare i visitatori al tuo sito. Quindi, è importante non pensare solamente all'ottimizzazione e all'uso di parole chiave, ma, più in generale, all'intera esperienza utente. La title tag costituisce la prima interazione di un nuovo visitatore col tuo brand e dovrebbe trasmettere un'impressione quanto più positiva possibile.

META DESCRIPTION

Il meta description tag è una sorta di breve descrizione dei contenuti di una pagina. I motori di ricerca non usano le parole chiave o le frasi presenti in questo tag per definire il posizionamento tra i risultati, ma le meta description costituiscono la principale fonte di informazioni utilizzata dai motori per generare la sintesi testuale riportata sotto ciascun risultato.

Il meta description tag ha una funzione pubblicitaria, attira i lettori verso il tuo sito dalla pagina dei risultati di ricerca ed è una componente estremamente importante del search marketing. Una descrizione facile da leggere e accattivante, creata usando le parole chiave più importanti (nota come Google evidenzia "in grassetto" nella descrizione le parole chiave ricercate), può aumentare in modo significativo il tasso di click through sui risultati della ricerca verso le tue pagine.

Le meta description possono essere di qualsiasi lunghezza, ma i motori normalmente estraggono una sintesi non più lunga di 160 caratteri, quindi è generalmente buona norma mantenersi sotto questo limite.

In assenza di meta description, i motori di ricerca creeranno il search snippet a partire da altri elementi della pagina. Si tratta di un’ottima tattica da adottare per quelle pagine che possiedono più parole chiave e trattano numerosi argomenti.

Meta Tag Meno Importanti

Meta keywords

Il meta keywords tag aveva importanza una volta, ma adesso non serve più a nulla nell’ottica dell'ottimizzazione per i motori di ricerca. Per scoprire di più sulla sua storia e sulla caduta in disuso del meta keyword tag, puoi leggere Meta Keywords Tag 101 su SearchEngineLand

Meta refresh, meta revisit-after, meta content type, ecc.

Sebbene questi tag possano essere utili ai fini dell'ottimizzazione per i motori di ricerca, non sono fondamentali, perciò lasceremo il compito di fornirti maggiori dettagli in merito alla Guida Strumenti per i Webmaster di Google - Meta Tags.

STRUTTURA URL

Gli URL, gli indirizzi web dei documenti, sono estremamente importanti sotto il profilo della ricerca. Appaiono in numerose e importanti posizioni.

Dal momento che motori di ricerca mostrano gli URL nei risultati, possono influire sui click-through e sulla visibilità. Gli URL sono anche usati nel posizionamento dei documenti, e quelle pagine i cui nomi includono i termini di ricerca per i quali è stata eseguita un’interrogazione beneficiano di un uso delle parole chiave corretto e descrittivo.

Gli URL possono comparire nella barra degli indirizzi del browser, e mentre ciò ha generalmente uno scarso impatto sui motori di ricerca, una struttura URL carente può determinare un'esperienza negativa per l’utente.

L'URL qui sopra è usato come anchor text del link che punta alla pagina precedentemente citata in questo post.

VERSIONI REGOLARI E DUPLICATE DEI CONTENUTI

Contenuti duplicati

I contenuti duplicati sono uno dei problemi più fastidiosi e seccanti che un sito può trovarsi a dover affrontare. Negli ultimi anni, i motori di ricerca hanno preso severi provvedimenti contro i contenuti duplicati e quelli particolarmente poveri, penalizzandoli e attribuendo loro posizionamenti peggiori.

Si parla di “canonicalizzazione” quando due o più versioni duplicate di una pagina web compaiono in corrispondenza di differenti URL. Ciò è molto comune nei moderni Content Management Systems (o CMS, piattaforme di gestione dei contenuti). Per esempio, potresti offrire una versione normale di una pagina e un'altra versione dello stesso contenuto "ottimizzata per la stampa". I contenuti duplicati possono anche comparire su più siti web. Per i motori di ricerca ciò costituisce un problema molto serio - quale versione di questi contenuti dovrebbero mostrare agli utenti? In ambito SEO, ci si riferisce spesso a questa problematica come “contenuti duplicati” - descritti qui in maniera più approfondita.

I motori sono molto selettivi quando si tratta di versioni duplicate di un singolo contenuto. Al fine di fornire la migliore esperienza d'uso agli utenti, difficilmente mostreranno parti di contenuti multipli o duplicati, e sono così costretti a decidere quale sia la versione che ha le maggiori possibilità di essere l'originale. Ne consegue che TUTTI i tuoi contenuti duplicati potrebbero ricevere un posizionamento peggiore di quanto invece non meriterebbero.

La canonicalizzazione consiste nella pratica di organizzare i tuoi contenuti in modo che ogni singolo pezzo possegga uno ed un solo URL. Se lasci versioni multiple di un contenuto su un sito web (o su più siti web), potresti trovarti in una situazione come quella illustrata qui a destra. Quale diamante è quello giusto?

I RICH SNIPPET

Hai mai visto un giudizio a 5 stelle in un risultato di ricerca? È probabile che il motore di ricerca abbia ricevuto quell'informazione da un rich snippet integrato nella pagina. I rich snippet sono un tipo di dati strutturati che permettono ai webmaster di contrassegnare i contenuti in modo da fornire maggiori informazioni ai motori di ricerca.

Sebbene l'uso di rich snippet e dati strutturati non sia un elemento obbligatorio in un design pensato per agevolare l’attività del motore di ricerca, il fatto che essi vengano utilizzati sempre più spesso sta a significare che i webmaster che li adottano possono trarne vantaggio in alcune circostanze.

Creare dei "dati strutturati" significa aggiungere dei contrassegni ai tuoi contenuti in modo che i motori di ricerca possano identificare facilmente di che tipo di contenuto si tratta. Schema.org fornisce diversi tipi di esempi di dati che possono trarre beneficio da una strutturazione. Questi includono persone, prodotti, recensioni, aziende, ricette ed eventi.

Spesso i motori di ricerca includono dati strutturati nei risultati di ricerca, come nel caso delle recensioni degli utenti (stelle) e dei profili degli autori (immagini). Esistono molte risorse online utili per imparare di più sui rich snippet, incluse le informazioni che si possono trovare su Schema.org e lo Strumento di Test dei Rich Snippet di Google.

Un esempio pratico di rich snippet

Poniamo caso che tu abbia deciso di annunciare una conferenza sulla SEO nel tuo blog. In un normale sistema HTML, il tuo codice potrebbe apparire così:

<div> Conferenza SEO<br/> Scopri di più sulla SEO dagli esperti del settore.<br/> Data dell'evento:<br/> 8 Maggio, 19:30 </div>

Ora, strutturando i dati, possiamo fornire ai motori di ricerca informazioni più specifiche sul tipo di dati. Il risultato finale sarebbe simile a questo:

<div itemscope itemtype="http://schema.org/Event"> <div itemprop="name">Conferenza SEO</div> <span itemprop="description">Scopri di più sulla SEO dagli esperti del settore.</span> Data dell'evento: <time itemprop="startDate" datetime="2012-05-08T19:30">8 Maggio, 19:30</time> </div>

DIFENDERE L'ONORE DEL TUO SITO

Come gli scraper rubano i tuoi posizionamenti

Sfortunatamente, il web è pieno di centinaia di migliaia (se non milioni) di siti senza scrupoli i cui modelli di business e traffico si basano sull’appropriazione dei contenuti di altri siti e sul loro riutilizzo (a volte dopo averli modificati in modi strani) sui propri domini. Questa pratica di prendere i contenuti di altri e ripubblicarli è detto "scraping" e gli scraper ottengono notevoli guadagni usando i contenuti altrui per superare nel posizionamento gli stessi siti a cui li hanno sottratti e mostrando poi della pubblicità (ironicamente, spesso tramite l’utilizzo del programma AdSense dello stesso Google).

Quando pubblichi contenuti in qualunque tipo di formato feed - RSS/XML/ecc. - assicurati di segnalarlo ai maggiori servizi di blogging e tracking (come Google, Technorati, Yahoo!, ecc.). Puoi trovare istruzioni su come effettuare la segnalazione a servizi quali Google e Technorati direttamente sui loro siti, oppure puoi usare un servizio come Pingomatic per automatizzare il processo. Se il tuo software di pubblicazione è personalizzato, è generalmente cosa saggia che lo sviluppatore (o gli sviluppatori) includa una auto-segnalazione ad ogni nuova pubblicazione.

Poi, puoi anche usare la pigrizia degli scraper contro loro stessi. La maggior parte degli scraper sul web ripubblicherà i contenuti senza modificarli, e così, includendo dei link che rimandano al tuo sito, e al post specifico che hai scritto, puoi far sì che i motori di ricerca vedano la maggior parte delle copie come collegate a te (segnalando così che la tua fonte è probabilmente quella originale). A tal fine, nella tua struttura di collegamenti interni dovrai usare dei link assoluti anziché relativi. Vale a dire, piuttosto che linkare alla tua home page usando:

<a href="/../>Home</a> Dovrai invece usare: <a href="http://moz.com">Home</a>

In tal modo, quando uno scraper prenderà il contenuto e lo copierà, il collegamento continuerà a puntare al tuo sito. Ci sono modi più sofisticati per proteggersi contro lo scraping, ma nessuno di essi è perfetto. Devi essere preparato: più popolare e visibile diventerà il tuo sito, più frequentemente ti ritroverai con i contenuti copiati e ripubblicati. Spesso puoi permetterti di ignorare questo problema, ma nel caso diventasse una cosa veramente seria e ti accorgessi che gli scraper ti rubano traffico e posizioni, puoi anche ricorrere ad un’azione legale per richiedere la rimozione dei contenuti sulla base di quanto disposto dal DMCA (Digital Millennium Copyright Act). Fortunatamente, il consulente interno di Moz, Sarah Bird, ha già realizzato un ottimo pezzo per aiutarti a risolvere proprio questo problema – “Quattro modi per far valere il tuo diritto d’autore: cosa fare se i tuoi contenuti online vengono rubati”.