Ho scritto le prime idee di questo post di getto quindi se trovi errori scusami fin da ora.
L’altro giorno avevo twittato che in appena 13 secondi (11 nello screenshot + 2 di refresh) Google è in grado di mettere in SERP già indicizzati gli aggiornamenti di stato di FriendFeed.
Arriva SEOGuru che mi invita a dire la mia su un thread nel Forum GT relativo a Caffeine.
Tutti pareri interessanti senza ombra di dubbio.
C’è chi ha individuato i datacenter di Caffeine e ha notato alcune differenze in SERP.
C’è anche chi ha notato che resta tutto uguale anche dopo “la caffettiera” e che i siti forti restano (com’era facile aspettarsi) in testa alle SERP.
C’è infine chi dice “me ne frego degli update perché io parlo ai miei utenti tramite il sito. Offro buoni contenuti e che arrivi un update Caffeine, Whisky o Lemonsoda l’importante è che il mio sito continui ad avere utenti”.
(Parere rispettabilissimo che condivido in pieno).
Ora mentre scambiavo idee con SEOGuru è venuto fuori un discorso abbastanza interessante che voglio condividere con te …
YouTube è il 2° motore di ricerca usato al mondo (dopo Google)
E YouTube è di Google.
Inoltre ha chiuso da poco la voragine dopo una acquisizione che al gigante di Mountain View ha portato solo ed esclusivamente perdite negli anni passati.
Naturalmente Google già dato una sua visione su YouTube: i primi contenuti uscitranno a breve a pagamento e non saranno soltanto gli annunci AdSense testuali e video ad alimentare il business.
Foto e video anche su Facebook e Flickr
Dall’altra parte c’è Facebook, che ha dichiarato (ormai mesi fa) che nei soli USA vengono caricate oltre 60 milioni di foto a settimana.
Lo leggi qui cliccando read more e il dato è molto vecchio tant’è che Quantast sulla pagina di Wikipedia dedicata a Facebook parla di 14 milioni di foto caricate al giorno.
Anche Yahoo! non scherza e Flickr ha raggiunto quota 4 miliardi a ottobre 2009 (fonte Wikipedia).
Una quantità dati considerevole in tutti e 3 i casi, ma credo che sia di gran lunga inferiore in termini di spazio e performance se confrontato con quella che devono sopportare i datacenter di YouTube.
Poi ci sono da gestire altri dati …
Aggiornamenti di stato e cinguettii
Se cambiamo punto di vista per un attimo e pensiamo agli aggiornamenti di stato di Facebook e ai tweet di Twitter invece il discorso assume una prospettiva diversa.
Ora abbiamo altri due giganti che si fronteggiano sulla “sostenibile leggerezza del post” : poche battute, a volte 4 o 5 parole che fluiscono in uno stream continuo.
Per una volta immaginiamo la cosa da un punto di vista tecnico.
Quali caratteristiche del filesystem ?
Occore un filesystem in grado di gestire entrabe queste entità: archiviarle, indicizzarle, ritrovarle, presentarle all’utente che ne fa richiesta.
Google ha introdotto Caffeine per dare più risalto al tempo reale.
Su questo siamo tutti d’accordo e i risultati sono evidenti in SERP.
Ma Matt Cutts ha dichiarato che Caffeine è prima di tutto un aggiornamento infrastrutturale dei datacenter di Google e non solo un nuovo algoritmo.
Al punto che puoi “disconnettere” uno dei datacenter per farci dei test o manutenzioni di qualsiasi tipo e lasciare che il traffico e le repliche si ribilancino da sole tra le altre macchine disponibili senza che questo impatti sul resto della rete di Google.
Certo dovremmo già essere anni luce lontani da Everflux…
Perché un problema fino a ora è stato il filesystem
E come poteva essere diversamente ?
Forse quando Google ha comprato YouTube, il GFS, il filesystem di Google (che è alla base delle Google Apps, come GMail & co) … dico forse non era ancora in grado di supportare a pieno i grossi grassi file multimediali di YouTube.
O forse non era in grado di gestirli al meglio.
Vorrei far notare che YouTube:
- ha lanciato a ottobre la ricerca in tempo reale tra i commenti degli utenti
- da diversi mesi permette di avviare il video in un momento esatto (aggiungendo un semplice parametro nella URL tipo t=1m40s) e questo è un dato molto indicativo di real time e di gestione del file system sottostante.
Che Google abbia testato in sordina Caffeine in YouTube per mesi, e lì sia già attivo al 100% e non ce ne siamo accorti ?
Ho trovato anche qualche approfondimento al riguardo qui e nei link indicati e questo PDF su “Colossus” che dovrebbe essere il nome in codice del GFS2.
Vuoi dire la tua ?
Hai notato modifiche sulle SERP che monitori e vuoi dire la tua su Caffeine ?
Oppure vuoi aggiungere qualche considerazione a questo articolo ?
Approfitta dello spazio commenti qui sotto.
{ 12 commenti… Leggi sotto oppure aggiungine uno }
Sì, dunque da gennaio io ho notato una diminuzione drastica di visitatori. Ma attenzione, i vecchi post, quelli indicizzati fino a dicembre conservano le vecchie posizioni mentre quelli nuovi fanno estrema fatica a posizionarsi venendo superati dagli aggiornamenti sui social networ. Praticamente appena pubblico un post lo trovo subito nelle serp ma con twitter e friendfeed. Il che mi porta a duna consideraione: si è sempre detto che più click fai fare al visitatore più sono alte le probabilità che se ne vada prima di aver ltto, e ora priviklegiamo i social in modo che il visitatore sia costretto a fare almeno 2 click per leggere un articolo, invece di uno come accadeva prima? Finora dalle ricerche io ho trovato solo cose che non mi interessano, prima no
Ciao vale,
quindi se ho capito bene dici di aver notato una inversione di tendenza e che Google a partire da Gennaio stia premiando più i social network anziché i blog.
Rispetto ai 2 click che dici ho un’idea diversa che qui ti espongo. Ogni utilizzatore dei social network ha preferenze diverse.
Ad esempio a me piace l’immediatezza di Twitter; ad altri può piacere più Facebook per ritrovare gli amici. A qualcun altro ancora potrebbe piacere più FriendFeed.
Non è detto cioè che una stessa persona usi tutti i social.
E non è detto neanche che qualora la stessa persona usi tutti i social ne faccia un uso identico con le stesse modalità e attenzioni.
Ti parlo delle mie preferenze perché sono quelle che conosco di più: trovo Twitter più pratico e trasversale rispetto agli altri social network.
Perché ci puoi accedere via web, via applicazioni desktop o via iPhone.
Se cerchi bene anche Facebook ti dà le stesse possibilità, ma Twitter ha quella rapidità e immediatezza in più che mi fa simpatizzare di più per questo social.
E preferisco le conversazioni che nascono su Twitter perché limitate a 140 caratteri, cioè alla cosa essenziale che vuoi comunicare che non riscontro ad esempio nelle discussioni negli altri social network che ho citato.
Credo che con Caffeine Google voglia dare una risposta all’utente, oltre che in real time, anche in base a questo aspetto di multicanalità.
Sono d’accordo sulle preferenze degli utilizzatori ma se ha senso che uno legga twitter e sicuramente non ci arriva da google ma dai preferiti e se uno non tra gli utilizzatori abituali di questi servizi, non ha senso che su google venga preferito twitter o ff nelle serp. L’utente che cerca notizie in google vuole subito risposte, non pretesti per fare altri click , IMHO. Il real time va a farsi friggere nel momento in cui ai primi posti oltre ai social vedo articoli del 2008 e 2007 addirittura. Insomma…
Ciao vale,
da una parte è giusto cosa dici. Ma non dimenticare che Google ha attivato la Social Search beta e si potrebbe verificare quello che con Giorgio Taverniti avevamo solo ipotizzato e cioè che oggi un sito web potrebbe ricevere visite verso pagine specifiche, anche consistenti a livello numerico, attraverso i link che si diffondono nei social network PRIMA ANCORA che Google le abbia messe in SERP.
Prima del Convegno GT avevo fatto alcuni test dai miei account personali sui vari social, oltre che da altri account sicuramente meno in trust dei miei. Ed è risultato davvero interessante la possibilità di posizionarsi per una chiave specifica anche se non molto competitiva in meno di 4 ore con un solo link da Twitter (e un retweet spontaneo).
Riguardo a Twitter o FriendFeed sono pagine pubblicamente accessibili come tante altre quindi è giusto -a mio avviso- che siano in SERP. A questo proposito però vorrei far presente che leggendo il brevetto originale del tanto citato TRUSTRANK, Google si riferisce ad un indicatore specifico.
Il trustrank per Google è un indicatore di trust, cioè livello di fiducia, che ricevono alcuni utenti in community, forum o altri siti verticali specializzati. E i social network ci rientrano al 100%.
Ma appunto, se essere sui social nework aumenta il trustrank dovrebbe essere il blog ad apparire nelle serp prima di essi, soprattutto se già aveva un buon posizionamento e un onesto utilizzo di seo prima di caffeine.
Ora non so come funzioni la storia dei duplicati con caffeine ma a me sembra esserci stato un peggioramento. Considera il problema dei copioni: se hai un basso trustrank perché il tuo blog è nuovo e uno con un trust superiore ti copia l’articolo, anche solo poche frasi (ho sperimentato che basta anche solo titolo e primi 200 caratteri anche se il tuo post ha 1000 parole!!) ora più di prima google fa presto a penalizzarti a vantaggio del copione.
Che può essere anche un sito che finge di funzionare come un aggregatore (ne ho incontrati ed erano TUTTI posizionati sopra di me mentre io finivo nei risutati omessi) .
E qui non stiamo parlando di social network ma di siti che copiano spudoratamente il tuo lavoro solo per posizionarsi ai primi posti col tuo lavoro causando una penalizzazione del tuo sito. Ma google non fa differenze: vede un sito che aggiorna frequentemente e lo scambia per aggregatore. Ora io spero che google velocizzi l’aggiornamento della cache perché non è possibile che se è tanto bravo a far apparire nelle serp in 10 minuti una cosa che hai scritto su twitter, fosse pure che sono andata dal parucchiere, poi ci impiega settimane per far sparire gli articoli duplicati dalle serp, perfino se l’autore li ha fatti rimuovere settimane prima, come succede a me. E su twitter e ff ci finisce titolo del post più 2-3 frasi. Tanto basta a google per decidere di considerare originali e unici i loro contenuti e te il duplicato. Si salvano solo i blog con pr di almeno 4 o 5 che invece ricevono la spinta verso l’alto delle serp. Questo ho notato.
P.s. preciso, io non sono seo ho solo un blog con pr 3 e tanti link da social, che nonostante prima di caffeine fosse ben posizionato nelle serp anche nei primi 5 posti per diverse keyword, da meta gennaio circa vede i suoi articoli finire nei risulta omessi mentre effettuando ricerche per titolo del post compaiono i soliti social e i copioni. Ora io capisco il trust etc, ma se su un sito ci sono 2 frasi più link alla fonte originale, google dovrebbe capire da solo che non è certo la fonte che copia il testo…se non ci fossero i link alla fonte lo capirei ma in twitter, ff social e aggregatori il link c’è eccome. Prima di caffeine se qualcuno copiava un mio articolo io segnalavo la pagina nello spamreport, facevo levare al copione la pagina e in pochi giorni tutto tornava a posto e io nelle serp. Ora no.
Ho anche provato a prendere vecchi articoli indicizzati dal veccho google da mesi e mesi fa, li ho twittati e messi su ff e social: ho ricevuto la famosa spinta verso l’alto nelle serp. Ma non la ricevo per gli articoli che pubblico da metà gennaio, mi sembra che caffeine sia operativo da gennaio…
Ciao vale,
tutto giusto quello che dici al punto che neanche Google fornisce una risposta “ufficiale” al problema che hai indicato di aggregazione/replica nei social network.
Ecco un caso interessante http://www.google.com/support/forum/p/webmasters/thread?tid=54feac9156fd97ae&hl=it , ma come questo ce ne sono tanti simili.
Ciao, grazie per il link. In effetti mi sembra che risposta non ci sia stata, anche io rispetto perfettamente le linee guida e ho pure fatto richiesta di riconsiderazione specificando a google che se su yahoo e altri motori il problema di duplicati e aggregatori non c’è, almeno nel mio caso, o se c’è lo risolvono in pochissimo tempo, allora vuole dire : o che loro sono meglio nella gestione dei duplicati; o che le linee guida di google non dicono tutto su come si deve fare un sito.
Il consiglio di cambiare testo è secondo me assurdo, se mandi un feed ad un aggregatore non puoi certo stare lì a cambiare testo ogni volta che pubblichi, l’ho fatto in passato, ho cambiato quelle 2-3 frasette che apparivano ma non ci sto più… Ciao grazie ancora
Francesco, non ci crederai. Pare che si sia risolto oggi, quindi vedi nel caso mio erano proprio quei 200 caratteri duplicati dagli aggregatori e social che mi abbassavano nelle serp, ora pare tutto a posto. Speriamo duri. Comunque conta 2-3 settimane nel mio caso come tempi di risoluzione, mi pare che caffeine reagisca più velocemente di prima con le penalizzazioni ma ci metta sempre un sacco di tempo a risolvere. Ciauz
Riguardo alla penalty che ti ho linkato prima so per certo che la situazione è stata ehm… “stabile” da prima di venerdì 13 Novembre fino a qualche giorno fa dove abbiamo iniziato a notare dei miglioramenti.
Mi auguro quindi che Caffeine reagisca più velocemente non solo in fase di indicizzazione/posizionamento ma anche quando i siti vanno in penalizzazione.
In tutta sincerità: il 5 ho mandato richiesta di riconsiderazione, il 7 ho inviato alcuni dettagli, tra cui un reclamo sulla gestione duplicati che lascia a desiderare. 24 ore dopo era tutto tornato a posto, mi hanno poi detto che hanno elaborato la richiesta….