Pagina 1 di 1

Articoli non ancora pubblicati ma già indicizzati

Inviato: lun lug 08, 2013 2:04 pm
da rumez
Volevo segnalarvi una cosa che non so se sia già nota: se eseguite questa ricerca https://www.google.it/search?q=site:turbolab.it noterete che ci sono già un sacco di articoli indicizzati in Google nonostante la maggior parte non sia ancora stata pubblicata. La cosa "brutta" è che sono indicizzate anche tutte le prove.

Re: Articoli non ancora pubblicati ma già indicizzati

Inviato: lun lug 08, 2013 2:21 pm
da Zane
Non è per nulla bello, ma purtroppo non ci si può fare molto, temo. Se non andare ad impazzire con il robot.txt (rischiando, fra l'altro, che un articolo spubblicato venga bloccato anche quando diviene finito e pubblicato), l'unica altra soluzione un po' più pragmatica che vedo è quella di "guidare" lo spider con la sitemap (in lavorazione)..

Re: Articoli non ancora pubblicati ma già indicizzati

Inviato: lun lug 08, 2013 2:24 pm
da rumez
Non è per niente bello no perché in questo modo l'indicizzazione prevarica la nostra coda di pubblicazione. :impreco

Però quello che mi domando è come lo spider di Google sia riuscito a seguire i link di quegli articoli che fino a prova contraria non sono "pubblici"

In ogni caso cancellerei almeno tutti i vari articoli di test.

Re: Articoli non ancora pubblicati ma già indicizzati

Inviato: lun lug 08, 2013 2:32 pm
da Andy94
Lo spider di Google ci arriva dalle liste, che sono pubbliche e mostrano i contenuti.
Infatti se clicchi su un link (ma comunque lo vedi anche dall'anteprima) ti accorgerai che i contenuti non sono accessibili (si vede solo il titolo). Tu li vedi completi perché quando arrivi a TLI sei autenticato.

La cosa migliore, come ha suggerito Zane, è costruire una sitemap che prenda in esame solo i contenuti pubblicati e disponibili (quindi che venga rifatta automaticamente da un cron job) e, lasciando quella nel server, lo spider saprà cosa fare e correggerà questi problemi.

Re: Articoli non ancora pubblicati ma già indicizzati

Inviato: lun lug 08, 2013 2:35 pm
da rumez
Non ho capito bene il discorso delle liste.

In ogni caso la sitemap da segnalare a Google può anche essere dinamica ( in php ) con filtro fisso articolo_pubblicato = S..quando Google la legge vedrà solo la lista degli articoli "indicizzabili"

Re: Articoli non ancora pubblicati ma già indicizzati

Inviato: lun lug 08, 2013 2:36 pm
da Zane
I "giri" che fa Google per rimpinguare i propri indici sono sempre molteplici e molto misteriosi :)

Ad ogni modo: non preoccuparti più di tanto. La coda di pubblicazione è solo un modo per cercare di distribuire la visibilità equamente in home. Se qualcuno è interessato ad un articolo e riesce a leggerlo prima della data di uscita, in realtà mi fa solo piacere (e se gli è anche utile a risolvere un problema che sta avendo, ancor di più!).

Di più: se un articolo non è marcato come "finito" dall'autore, solo gli utenti con autorevolezza elevata riescono a vederlo nella sua completezza.

Comunque: Cat sta, pian pianino, "riciclando" tutte le varie prove. Io cerco di fare lo stesso.

Re: Articoli non ancora pubblicati ma già indicizzati

Inviato: lun lug 08, 2013 2:41 pm
da rumez
Sicuramente allo stato attuale possiamo trarre vantaggio da questa situazione visto che siamo ancora semi sconosciuti.

E' solo brutto che si vedano i test..ma se stanno venendo via via rimpiazzati allora siamo a posto. :lol: