Riflettici. Perché crei un sito web? Per permettere ai tuoi potenziali clienti o al tuo pubblico di trovarti facilmente e per distinguerti tra la concorrenza, giusto? Come fa il tuo contenuto ad essere effettivamente visto? Tutto il contenuto sul tuo sito viene sempre visto?

Perché devi trovare tutte le pagine sul tuo sito web

È possibile che pagine contenenti informazioni preziose che effettivamente necessitano di essere viste, non vengano affatto visualizzate. Se questo è il caso del tuo sito web, allora probabilmente stai perdendo un notevole traffico, o addirittura potenziali clienti.

Anche potrebbero esserci pagine che sono raramente viste, e quando lo sono, utenti/visitatori/potenziali clienti si trovano in un vicolo cieco, poiché non possono accedere ad altre pagine. Possono solo andarsene. Questo è tanto male quanto quelle pagine che non vengono mai viste. Google inizierà a notare gli alti tassi di rimbalzo e a mettere in dubbio la credibilità del tuo sito. Questo farà sì che le tue pagine web vengano classificate sempre più in basso.

Come il tuo contenuto arriva effettivamente a essere visto

bot di motore di ricerca alla ricerca di pagine web

Perché utenti, visitatori o potenziali clienti vedano il tuo contenuto, è necessario che venga eseguito il crawling e l'indicizzazione, e che ciò avvenga frequentemente. Cos'è il crawling e l'indicizzazione?

Cos'è la scansione e l'indicizzazione?

Perché Google mostri i tuoi contenuti agli utenti/visitatori/potenziali clienti, deve prima sapere che il contenuto esiste. Questo avviene tramite la scansione. Questo è il momento in cui i motori di ricerca cercano nuovo contenuto e lo aggiungono al suo database di contenuti già esistenti.

Cosa rende possibile lo strisciare?

  • Link
  • Mappa del sito
  • Sistemi di Gestione dei Contenuti (CMS - Wix, Blogger)

Quando aggiungi un link da una pagina esistente a un'altra nuova pagina, ad esempio tramite testo ancora, i bot dei motori di ricerca o i ragni sono in grado di seguire la nuova pagina e aggiungerla al 'database' di Google per riferimenti futuri.

Mappa del sito:

Questi sono anche noti come XML Sitemaps. Qui, il proprietario del sito invia un elenco di tutte le sue pagine al motore di ricerca. Il webmaster può anche includere dettagli come l'ultima data di modifica. Le pagine vengono poi esplorate e aggiunte al ‘database’. Questo processo però non è in tempo reale. Le tue nuove pagine o contenuti non verranno esplorati non appena invii la tua sitemap. L'esplorazione può avvenire dopo giorni o settimane.

La maggior parte dei siti che utilizzano un Content Management System (CMS) generano automaticamente questi, quindi è una sorta di scorciatoia. L'unico momento in cui un sito potrebbe non avere la mappa del sito generata è se hai creato un sito web da zero.

esempio di una mappa del sito

CMS:

Se il tuo sito web è gestito da un CMS come Blogger o Wix, il fornitore di hosting (in questo caso il CMS) è in grado di "dire ai motori di ricerca di esplorare qualsiasi nuova pagina o contenuto sul tuo sito web".

Ecco alcune informazioni per aiutarti con il processo:

Aggiungere una sitemap a WordPress

Visualizzazione della sitemap

Dove si trova la sitemap per Wix?

Mappa del sito per Shopify

Cos'è l'indicizzazione?

L'indicizzazione, in termini semplici, è l'aggiunta delle pagine e dei contenuti esplorati nel 'database' di Google, che in realtà è chiamato indice di Google.

Prima che i contenuti e le pagine vengano aggiunti all'indice, i bot dei motori di ricerca si sforzano di comprendere la pagina e il contenuto al suo interno. Procedono addirittura a catalogare file come immagini e video.

Ecco perché, in qualità di webmaster, l'SEO on-page risulta utile (titoli delle pagine, intestazioni e uso del testo alternativo, tra gli altri). Quando la tua pagina o le tue pagine presentano questi aspetti, diventa più facile per Google "comprendere" il tuo contenuto, catalogarlo in modo appropriato e indicizzarlo correttamente.

Utilizzo di robots.txt

A volte, potresti non volere che alcune pagine vengano indicizzate, o parti di un sito web. Devi fornire direttive ai bot dei motori di ricerca. Utilizzare tali direttive rende anche lo strisciamento e l'indicizzazione più semplici, poiché ci sono meno pagine che vengono esplorate. Scopri di più su robots.txt qui.

robots.txt

Utilizzo di ‘noindex’

Puoi anche utilizzare questa altra direttiva se ci sono pagine che non vuoi che appaiano nei risultati di ricerca. Scopri di più sul noindex.

Prima di iniziare ad aggiungere noindex, vorrai identificare tutte le tue pagine in modo da poter pulire il tuo sito e renderlo più facile per i crawler esplorare e indicizzare correttamente il tuo sito.

Quali sono alcune ragioni per cui è necessario trovare tutte le tue pagine?

Cosa sono le pagine orfane?

Una pagina orfana può essere definita come una che non ha collegamenti da altre pagine del tuo sito. Questo rende quasi impossibile che queste pagine vengano trovate dai bot dei motori di ricerca, e in aggiunta dagli utenti. Se i bot non riescono a trovare la pagina, allora non la mostreranno nei risultati di ricerca, il che riduce ulteriormente le possibilità che gli utenti la trovino.

Come nascono le pagine orfane?

Le pagine orfane possono risultare da un tentativo di mantenere privato il contenuto, errori di sintassi, refusi, contenuto duplicato o contenuto scaduto che non è stato collegato. Ecco altri modi:

  • Pagine di test che sono state utilizzate per test A/B e che non sono mai state disattivate
  • Pagine di destinazione basate su una stagione, ad esempio, Natale, Ringraziamento o Pasqua
  • Pagine 'dimenticate' a seguito di migrazione del sito

Che dire delle pagine senza uscita?

A differenza delle pagine orfane, le pagine senza uscita hanno collegamenti da altre pagine del sito web ma non linkano ad altri siti esterni. Esempi di pagine senza uscita includono pagine di ringraziamento, pagine di servizi senza inviti all'azione, e pagine di "nessun risultato trovato" quando gli utenti cercano qualcosa tramite l'opzione di ricerca.

Quando hai pagine senza uscita, le persone che le visitano hanno solo due opzioni: lasciare il sito o tornare alla pagina precedente. Ciò significa che stai perdendo un traffico significativo, specialmente se queste pagine si rivelano essere 'pagine principali' sul tuo sito web. Ancora peggio, gli utenti rimangono frustrati, confusi o si chiedono, 'cosa c'è dopo'?

Se gli utenti lasciano il tuo sito provando frustrazione, confusione o qualsiasi emozione negativa, è improbabile che tornino, proprio come i clienti insoddisfatti non acquisteranno mai più da un marchio.

Da dove provengono le pagine senza uscita?

Le pagine senza uscita sono il risultato di pagine senza inviti all'azione. Un esempio potrebbe essere una pagina "chi siamo" che accenna ai servizi offerti dalla tua azienda ma non ha alcun collegamento a tali servizi. Una volta che il lettore comprende ciò che motiva la tua azienda, i valori che sostieni, come è stata fondata l'azienda e i servizi che offri e già si sente coinvolto, devi dirgli cosa fare dopo.

Un semplice pulsante di chiamata all'azione "visualizza i nostri servizi" farà al caso tuo. Assicurati che il pulsante, quando cliccato, apra effettivamente la pagina dei servizi. Non vuoi che l'utente si ritrovi con un errore 404, che lo/la lascerebbe frustrato/a allo stesso modo.

pagina senza uscita

Cosa sono le pagine nascoste?

Le pagine nascoste sono quelle che non sono accessibili tramite un menu o una navigazione. Anche se un visitatore potrebbe essere in grado di visualizzarle, specialmente attraverso testo di ancoraggio o link in entrata, possono essere difficili da trovare.

Le pagine che rientrano nella sezione categoria sono probabilmente anche pagine nascoste, poiché si trovano nel pannello di amministrazione. Il motore di ricerca potrebbe non essere mai in grado di accedervi, poiché non accede alle informazioni memorizzate nei database.

Le pagine nascoste possono anche derivare da pagine che non sono mai state aggiunte alla sitemap del sito ma esistono sul server.

Tutte le pagine nascoste dovrebbero essere eliminate?

Non proprio. Ci sono pagine nascoste che sono assolutamente necessarie e che non dovrebbero mai essere accessibili dalla tua navigazione. Vediamo degli esempi:

Iscrizioni alla newsletter

Puoi avere una pagina che elenca i vantaggi dell'iscrizione alla newsletter, con quale frequenza gli utenti dovrebbero aspettarsi di riceverla, o una grafica che mostra la newsletter (o la newsletter precedente). Ricorda di includere anche il link per l'iscrizione.

Pagine contenenti informazioni sull'utente

Le pagine che richiedono agli utenti di condividere le loro informazioni dovrebbero sicuramente essere nascoste. Gli utenti devono creare un account prima di poterle accedere. Anche le iscrizioni alla newsletter possono essere classificate qui.

Come trovare pagine nascoste

Come abbiamo accennato, puoi trovare pagine nascoste utilizzando tutti i metodi che vengono usati per trovare pagine orfane o senza uscita. Esploriamo ancora alcuni.

Utilizzo di robots.txt

Le pagine nascoste sono molto probabilmente nascoste anche ai motori di ricerca tramite robots.txt. Per accedere al file robots.txt di un sito, digita [nome dominio]/robots.txt nel browser e premi invio. Sostituisci 'nome dominio' con il nome del dominio del tuo sito. Fai attenzione alle voci che iniziano con 'disallow' o 'nofollow'.

Trovare manualmente

Se vendi prodotti tramite il tuo sito web, ad esempio, e sospetti che una delle tue categorie di prodotti possa essere nascosta, puoi cercarla manualmente. Per farlo, copia e incolla l'URL di un altro prodotto e modificalo di conseguenza. Se non lo trovi, allora avevi ragione!.

Cosa succede se non hai idea di quali potrebbero essere le pagine nascoste? Se organizzi il tuo sito web in directory, puoi aggiungere il tuo nome-dominio/nome-cartella al browser di un sito e navigare attraverso le pagine e le sotto-directory.

Una volta che hai trovato le tue pagine nascoste (e non devono rimanere nascoste come discusso sopra), devi aggiungerle alla tua sitemap e inviare una richiesta di scansione.

Come trovare tutte le pagine sul tuo sito

Devi trovare tutte le tue pagine web per sapere quali sono senza uscita o orfane. Esploriamo i diversi modi per raggiungere questo obiettivo:

Utilizzo del tuo file sitemap

Abbiamo già esaminato le sitemap. La tua sitemap sarebbe utile quando analizzi tutte le tue pagine web. Se non hai una sitemap, puoi utilizzare un generatore di sitemap per generarne una per te. Tutto ciò che devi fare è inserire il nome del tuo dominio e la sitemap verrà generata per te.

Utilizzo del tuo CMS

Se il tuo sito è gestito da un sistema di gestione dei contenuti (CMS) come WordPress, e la tua sitemap non contiene tutti i link, è possibile generare l'elenco di tutte le tue pagine web dal CMS. Per fare ciò, utilizza un plugin come Export All URLs.

Utilizzo di un registro

Un registro di tutte le pagine fornite ai visitatori è anche utile. Per accedere al registro, effettua l'accesso al tuo cPanel, poi cerca 'file di log grezzi'. In alternativa, richiedi al tuo fornitore di hosting di condividerlo. In questo modo puoi vedere le pagine più visitate frequentemente, le pagine mai visitate e quelle con i tassi di abbandono più alti. Pagine con tassi di rimbalzo elevati o nessun visitatore potrebbero essere pagine senza uscita o orfane.

Utilizzo di Google Analytics

Ecco i passaggi da seguire:

Passo 1: Accedi alla tua pagina Analytics.

Passaggio 2: Vai su "comportamento" poi "contenuto del sito"

Passaggio 3: Vai a "tutte le pagine"

Passaggio 4: Scorri fino in fondo e sulla destra scegli ‘mostra righe’

Passaggio 5: Seleziona 500 o 1000 a seconda di quante pagine stimeresti che il tuo sito abbia

Passo 6: Scorri verso l'alto e in alto a destra scegli ‘export’

Passo 7: Scegli ‘esporta come .xlsx’ (excel)

Passaggio 8: Una volta esportato l'excel scegliere ‘dataset 1’

Passaggio 9: Ordina per "visualizzazioni di pagina uniche".

Passaggio 10: Elimina tutte le altre righe e colonne ad eccezione di quella con i tuoi URL

Passo 11: Utilizza questa formula sulla seconda colonna:

=CONCATENATE("http://domain.com",A1)

Passaggio 12: Sostituisci il dominio con il dominio del tuo sito. Trascina la formula in modo che venga applicata anche alle altre celle.

Ora hai tutti i tuoi URL.

Se vuoi convertirli in collegamenti ipertestuali per poterli cliccare facilmente e accedervi quando cerchi qualcosa, passa al passaggio 13.

Passo 13: Utilizza questa formula sulla terza riga:

=HYPERLINK(B1)

Trascina la formula in modo che venga applicata anche alle altre celle.

Digitazione manuale nella query di ricerca di Google

Puoi anche digitare questo sito: www.abc.com nella barra di ricerca di Google. Sostituisci 'abc' con il nome del tuo dominio. Otterrai risultati di ricerca con tutti gli URL che Google ha esplorato e indicizzato, inclusi immagini, link a menzioni su altri siti e persino hashtag a cui il tuo marchio può essere collegato.

Puoi quindi copiare manualmente ciascuno e incollarli su un foglio di calcolo Excel.

come fare una query di ricerca su Google

Cosa fai quindi con la tua lista di URL?

A questo punto, potresti chiederti cosa devi fare con la tua lista di URL. Vediamo le opzioni disponibili:

Confronto manuale con i dati di log

Una delle opzioni sarebbe quella di confrontare manualmente la tua lista di URL con il log del CMS e identificare le pagine che sembrano non avere affatto traffico, o che sembrano avere i tassi di rimbalzo più alti. Puoi poi utilizzare uno strumento come il nostro per verificare i link in entrata e in uscita per ciascuna delle pagine che sospetti essere orfane o senza uscita.

Un altro approccio consiste nel scaricare tutti i tuoi URL come file .xlsx (excel) e anche il tuo log. Confrontali affiancati (in due colonne per esempio) e poi usa l'opzione "rimuovi duplicati" in excel. Segui le istruzioni passo dopo passo. Al termine del processo, ti rimarranno solo pagine orfane e senza uscita.

Il terzo approccio di confronto consiste nel copiare due set di dati - il tuo log e la lista degli URL su Google Sheets. Questo ti permette di utilizzare questa formula: =VLOOKUP(A1, A:B,2,) per cercare gli URL che sono presenti nella tua lista di URL, ma non nel tuo log. Le pagine mancanti (visualizzate come N/A) dovrebbero essere interpretate come pagine orfane. Assicurati che i dati del log siano nella prima o nella colonna di sinistra.

Utilizzo degli strumenti di crawling del sito

L'altra opzione sarebbe caricare la tua lista di URL su strumenti che possono eseguire scansioni del sito, attendere che eseguano la scansione del sito e poi copiare e incollare i tuoi URL su un foglio di calcolo prima di analizzarli uno per uno, e cercare di capire quali sono orfani o senza uscita.

Queste due opzioni possono richiedere molto tempo, specialmente se hai molte pagine sul tuo sito, giusto?

Beh, che ne dici di uno strumento che non solo trova tutti i tuoi URL ma ti permette anche di filtrarli e mostra il loro stato (così che tu sappia quali sono senza uscita o orfani?). In altre parole, se vuoi una scorciatoia per trovare tutte le pagine del tuo sito SEOptimer's SEO Crawl Tool.

Strumento di scansione SEO di SEOptimer

Questo strumento ti permette di accedere a tutte le pagine del tuo sito. Puoi iniziare andando su "Website Crawls" e inserire l'url del tuo sito web. Clicca su "Crawl"

inserisci l'URL del tuo sito web e premi "crawl" strumento seoptimer

Una volta terminato il crawl puoi cliccare su “Visualizza Rapporto”:

come visualizzare il rapporto dallo strumento di scansione di seoptimer

Il nostro strumento di scansione rileverà tutte le pagine del tuo sito web e le elencherà nella sezione “Pagina Trovata” della scansione.

sezione delle pagine trovate dello strumento di scansione di seoptimer

Puoi identificare problemi di “Errore 404” nella nostra sezione “Problemi Riscontrati” proprio sotto la sezione “Pagine Trovate”:

come trovare eventuali problemi dal rapporto del tuo strumento di scansione seoptimer

I nostri crawler possono identificare altri problemi come trovare pagine con Title mancante, Meta Descriptions, ecc. Una volta trovate tutte le tue pagine, puoi iniziare a filtrare e lavorare sui problemi in questione.

In conclusione

In questo articolo abbiamo esaminato come trovare tutte le pagine del tuo sito e perché è importante. Abbiamo anche esplorato concetti come pagine orfane e pagine senza uscita, così come pagine nascoste. Abbiamo differenziato ognuna, come identificare ciascuna tra i tuoi URL. Non c'è momento migliore per scoprire se stai perdendo a causa di pagine nascoste, orfane o senza uscita.