Archivio per la categoria ‘Spam’

La mia nuova guida gratuita al posizionamento

Aprile 30, 2008

Dopo alcuni mesi di raccolta ed organizzazione dei dati, finalmente sono a presentarvi la mia prima guida gratuita al posizionamento sui motori di ricerca, distribuita gratuitamente da Prima Posizione Srl.

Il web sta diventando sempre più una costante per chiunque cerchi informazioni riguardanti qualsiasi argomento e prodotto. Il mezzo più utilizzato, diretto ed immediato per raggiungere questo scopo sono i motori di ricerca, che permettono di trovare siti attinenti alle parole chiave ricercate.

La guida è stata ideata, scritta e sviluppata direttamente dal sottoscritto (SEO ed amministratore di Prima Posizione SRL) dove, grazie a 12 linee guida, spiego i fattori che determinano il successo di un sito sui motori di ricerca (in particolare su Google).

In particolar modo, questa guida è un sunto di tutte le mie esperienze di ottimizzazione e promozione dei siti internet, inoltre è strutturata in modo tale da fornire le nozioni fondamentali al ranking e di coinvolgere webmaster in un percorso formativo riguardante l’ottimizzazione, la promozione, il monitoraggio ed il mantenimento delle posizioni acquisite sui motori di ricerca senza infrangere le linee guida di quest’ultimi (quindi niente tecniche black-hat).

Per stuzzicare un poco la vostra curiosità, vi anticipo l’indice della guida:

1] CHIAREZZA: differenze fra motori di ricerca e directory
2] DEFINIZIONE: Target, studio della concorrenza, scelta delle keywords e dominio
3] OTTIMIZZAZIONE: del sito, i fattori on-page
4] ISTRUZIONE: come istruire i motori di ricerca sull’indicizzazione del sito
5] INDICIZZAZIONE: registrazione ed inserimento del sito all’interno dei motori
6] PROMOZIONE: i fattori Off-Page
7] LINKBULDING: costruire una popolarità in Trust
8] MONITORAGGIO: controllare i risultati ottenuti
9] MANTENIMENTO: come mantenere i risultati nel tempo e migliorarli
10] CONTROLLO: azioni e comandi di controllo
11] MIGRAZIONE: come non perdere il posizionamento quando si effettuano cambiamenti alle pagine
12] DA EVITARE: tecniche ed azioni pericolose che un SEO non deve fare

Oltre ad essere completamente gratuita, la guida SEO di Prima Posizione è completamente ridistribuibile dai webmaster sui propri siti e blog, oppure anche riprodotta su vari formati digitali; sempre a patto che i contenuti, le immagini ed i links non vengano modificati (sapete quanto sono importanti per il copyright).

Ora non resta altro che scaricare qui la guida ed appassionarsi a questo affascinantissimo mondo SEO.

Video di presentazione:

Attendo qui i vostri commenti, critiche e proposte in merito.

Grazie, a presto.

Google vs MSN-Live nella lotta contro lo SPAM

Gennaio 11, 2008

Google è il precursore nella lotta allo SPAM nelle proprie SERP, ed in questi ultimi periodi s’è sentito molto parlare della battaglia che Google sta sostenendo contro la vendita e l’acquisto di backlinks.

Google vs MSN-Live strategie differenti contro lo SPAM nelle Serp

“Non acquistare link a pagamento! I link a pagamento sono un male per il tuo sito! I motori di ricerca non consentono la compravendita di links ai fini di incrementare il ranking fra i risultati delle ricerche!”

Hai mai sentito queste parole? Se sei un webmaster oppure un SEO credo proprio di SI, infatti sono i nuovi passi del “Vangelo secondo Google” per ridurre lo Spam presente nei propri indici.

Ad ogni modo, non tutti i motori di ricerca hanno adottato la linea dura come i Californiani come affermano di essere. Difatti MSN-Live non tratta il commercio dei links necessariamente come un tabù.

A tal proposito, alcune dichiarazioni di Geramia Andrick (product manager di MSN Live Webmaster Tools) riguardanti Paid Links (link a pagamento) e Cloacking mi hanno fatto riflettere.

Google non tollera alcun tipo di cloaking perchè desidera vedere ed indicizzare esattamente ciò che gli utenti finali vedono sul sito interner posizionato (difatti solitamente il cloaking è una tecnica che elude i filtri antispam facendo vedere allo spider una pagina ottimizzata, mentre agli utenti la pagina con layout accattivante definitiva del sito).

Inoltre, Google teme i Paid Links perchè potrebbero sovvertire l’integrità del proprio sistema che è basato principalmente sul calcolo del ranking tramite l’analisi dei link (ritenuti come indice di qualità di un sito).

Per tanto, il motore di ricerca Californiano tutela la propria autorità ed efficienza nel modo più semplice possibile: penalizzando, o peggio ancora, bannando i siti trasgressori delle proprie guidelines.

Con molta sorpresa, ho scoperto che il gruppo Microsoft, con MSN-Live non segue in toto ogni decisione attuata da Google (almeno non per tutto). In questi termini, non che MSN consigli l’utilizzo di cloacking oppure di acquistare/vendere links, ma non ne vieta in alcun modo l’attuazione sui propri siti.

In effetti, MSN Live Search inizia a dare i primi segnali di vita, dimostrandosi molto più interessante di prima soprattutto per quanto riguarda il miglioramento della qualità dei risultati ed in termine di comunicazione col webmaster e gestore del sito.

In questi termini, Nathan Buggia di Live Search, in un’email su questi temi ha dichiarato:

“I link a pagamento sono una ‘Zona Grigia’. Sono davvero utili all’utente? Talvolta lo sono ma spesso sono meno rilevanti rispetto ai collegamenti organici all’interno di una pagina. Per il momento ci riserviamo il diritto di trattarli in questo modo.”

Quella Zona Grigia, lascia proprio presupporre che l’argomento sia ancora in fase di studio, visto che alcuni link a pagamento vengono considerati utili ed altri meno. A mio avviso, Live Search sta lavorando sulle metodologie per valutare al meglio la qualità di un backlinks (che sia a pagamento oppure spontaneo poco importa) prima di attribuirgli la corretta autorità e “potenza” in termini di spinta al posizionamento organico.

Anche per quanto riguarda il Clocking, MSN Live sempra porsi in modo più morbido rispetto al concorrente Google soprattutto in riferimento ai siti con forti difficoltà di indicizzazione (come i website realizzati con Flash o tecnologie analoghe).

Questi sono solo due esempi di politiche differenti per la lotta contro lo SPAM in modo da migliorare la qualità delle SERP e del servizio offerto agli utenti. Proprio gli utenti saranno gli arbitri indiscussi nel giudizio finale di chi ha indovinato le proprie strategie e politiche aziendali.

A cura di Michele De Capitani
Prima Posizione Srl - Pubblicità online

Google, ottimizzazione del sito: i Meta Tag

Settembre 25, 2007

Alcuni consigli su come ottimizzare i propri meta tag, renderli più efficaci dal lato Utente e valutarne l’importanza (o meno) per il motore di ricerca californiano.

Google, ottimizzazione del sito. I Meta tag.

Sempre più spesso mi capita di sentire e vedere webmaster che utilizzano i meta tag in modo scorretto, almeno non ottimizzato per i motori di ricerca, soprattutto per Google. Inoltre, negli ultimi tempi, si è diffusa la “simpatica” pratica di inventare (letteralmente) appositi metatag che dovrebbero incrementare le performance del sito in termini di posizionamento nelle ricerche.

Spero con questo post, di fare chiarezza, ma soprattuto far evitare “errori gravi” a chi sviluppa pagine web utilizzando meta tag a volte in modo estremamente scorretto per gli spider dei search engine.

La dichiarazione

I meta tag vengono elencati nell’head della pagina web, quindi devono essere esclusivamente compresi fra i tag <head> e </head>
La sintassi correttà è questa: <META NAME=”nome-metatag” content=”contenuto/variabili del meta.”>

Meta tag disponibili e scopi (approvati dal W3C)

Prima di elecare i tag, tengo a precisare che le caratteristiche riportate di seguito sono gli utilizzi effettivi per i quali questi meta tag sono stati creati, ma non significa che i motori di ricerca ne tengano conto, proprio come vedremo più avanti.

1) “Description” - Serve per dare una breve descrizione della pagina. La sua lunghezza massima è di 1024 caratteri (comunque si consiglia di usarne al massimo 100-120). Può essere costituito da due frasi, ma deve sempre terminare con il punto (es. <META NAME=”description”
content=”Seomarketingnews, il blog dedicato al SEO ed al web marketing.”> )

2) “Keywords” - Serve per indicare le parole chiave relative al contenuto della pagina. Anche qui la lunghezza massima è di 1024 caratteri, ma si consiglia di non superare un massimo di 5-6 parole chiavi elencate. Ogni singola keywords dev’essere separata da una virgola ed uno spazio (es. <META NAME=”keywords” content=”marketing, web, articoli, seo, motori, ricerca”> )

3) “Robots” - Creato per istruire il robot (spider di qualsiasi motore di ricerca) sugli accessi alla pagina web. Infatti può passare al robot 6 differenti istruzioni:
> “NOINDEX” - lo spider non è autorizzato ad indicizzare la pagina (quindi questa “non dovrebbe” mai comparire fra i risultati delle ricerche)
> “INDEX” - al contrario del NOINDEX autorizza il robot ad indicizzare il contenuto della pagina nei propri database
> “NOFOLLOW” - indica allo spider di non seguire e conteggiare ogni link presente all’interno della pagina (es. con l’attributo “NOFOLLOW” se nella pagina A c’è un collegamento alla pagina B, lo spider indicizzerà la pagina A ma non indicizzerà la pagina B e tantomeno conteggerà il backlink ai fini del calcolo del Pagerank)
> “FOLLOW” - funzione inversa al NOFOLLOW, che autorizza lo spider a conteggiare e visitare tutti i link presenti nella pagina web
> “ALL” = “INDEX” + “FOLLOW” (indicare ALL è come dire di indicizzare la pagina e seguire i link in essa contenuti)
> “NONE” = “NOINDEX” + “NOFOLLOW” (contrario della precedente soluzione)
> “NOODP” - impedisce ai motori di ricerca di utilizzare l’eventuale descrizione di DMOZ (ODP) nei risultati delle ricerche. La sintassi corretta è questa: <META NAME=”ROBOTS” CONTENT=”NOODP”>
I parametri passati, dovranno essere separati da una virgola e da uno spazio (es. <META NAME=”robots” content=”INDEX, NOFOLLOW”> )

4) “Generator” - Indica il programma/software che ha generato la pagina web. Può avere una lunghezza massima di 1024 ma si consiglia di non superare i 100 caratteri (es. META NAME=”generator” content=”Dreamweaver 2.0″> )

5) “Author” - Serve per evidenziare l’autore della pagina ed eventualmente i suoi contatti. Anch’esso può essere lungo fino a 1024 ma meglio porsi il limite di 100 caratteri. (es. <META NAME=”author” content=”Michele De Capitani, michele[at]prima-posizione.it”> )

6) Meta “HTTP-EQUIV” - identifica alcuni parametri che servono al browser per una corretta lettura della pagina oppure per altre funzioni particolari. Nel dettaglio, gli attributi sono:
> “Content-Type” - Indica la codifica della pagina o la tavola dei caratteri utilizzata. La sintassi corretta è questa: <META HTTP-EQUIV=”Content-Type” content=”text/html;charset=utf-8″>
> “Refresh” - Utilizzato per reindirizzare in modo automatico, dopo tot secondi, l’utente su un’altra pagina web. Un esempio concreto potrebbe essere questo: <META HTTP-EQUIV=”refresh” content=”5; URL=http//www.prima-posizione.it/”> dove, nella dichiarazione del contenuto, la prima parte numerica indica i secondi di attesa per il reindirizzamento automatico (in questo caso 5 secondi) mentre il parametro URL= serve per indicare la nuova pagina di destinazione.
> “Expires” - Indica la data di validità della pagina web (es. <META HTTP-EQUIV=”EXPIRES” content=”08/20/2001″> )

Questi sono tutti i metatag disponibili oggi per i webmaster, non e esistono altri tipo: “keypharase”, “Google”, “prayer”… alcuni moto divertenti ma che non offrono nulla di più alla pagina, visto che non vengono interpretati dai robots.

Ottimizzazione dei Meta tag

Allora, inziamo ad eliminare tutti meta superflui, perchè non più considerati oppure inutili e ritenuti ovvi agli occhi degli spider:

METATAG INUTILI:

- Keywords: infatti, ormai da un bel po’ di tempo, viene completamente ignorato da “quasi” tutti i motori di ricerca. Anzi, per Google, la presenza massiccia di parole chiave all’interno di questo meta potrebbe far scattare un campanello dall’arme per sovraottimizzazione (per altro inutile).

- Robots: i pareri su questo meta sono discordanti, comunque a mio avviso risulta essere un meta inutile perchè le funzioni “INDEX, FOLLOW e ALL” sono sotto intese, visto che lo spider è nato allo scopo di indicizzare pagine e seguirne i link. Per gli altri attributi invece, lo stesso Google, consiglia di utilizzare il file robots.txt per bloccare lo spider su determinate pagine e di adottare l’attributo “NOFOLLOW” nei link che non si desidera far seguire al robot (proprio come succede nei commenti dei blog). ECCEZIONE: l’attributo “NOODP” che a volte risulta strategico mettere per aver maggiori click sui propri link (vedi Ottimizzazione del meta tag Description).

- Generator: difatti non serve a nulla ai fini del motore di ricerca ed anche il suo valore per l’utenza è relativamente scarso

- Author: vedi quanto detto per Generator, se si vuole “proteggere” i propri contenuti con copyright meglio scrivere le referenze nel footer di ogni pagina

OTTIMIZZAZIONE DEI RESTANTI METATAG

- “Description” - Questo meta, ai fini del posizionamento non è considerato dai motori di ricerca, comunque la sua ottimizzazione è importante per due aspetti: il primo è lato utente, cioè se all’interno della descrizione mettiamo le parole chiave per le quali intendiamo posizionare il sito, Google visualizzerà nei risultati porzioni del tag description contenenti per l’appunto le keywords. Il secondo invece, è lato motore, difatti differenziare per ogni singola pagina web il meta description agevola ed evita alla pagina di finire fra i risultati omessi per pagine “similari”.
Quindi, il consigli è quello di diversificare sempre ogni meta description che verrà costruito in modo tale da contenere le parole chiave scelte per quella pagina ma contestualizzate in una frase di 2-3 righe (100-150 caratteri) con un senso logico e descrittivo. Come anticipato prima, è fondamentale a tal fine, inibire la descrizione di ODP con l’apposito meta tag “Robots” attributo “NOODP”.

- I meta “Content-Type” e “Expires” sono a completa discrezione del web master, non sono fondamentali ma se vengono indicati non generano alcun danno

- “refresh” - Questo meta è molto importante ed altrettanto “pericoloso”. Infatti, fino a poco tempo fa, l’utilizzo di questo tag era considerato SPAM da Google & Co. perchè utilizzato principalmente nelle Doorways generate dagli spammer che passavano un determinato codice agli spider, mentre reindirizzavano l’utente sulla pagina ottimale. Ora, invece, viene considerato SPAM solamente nel caso in cui il tempo sia impostato con un valore superiore allo “0″ (zero) e la pagina sia ricca di contenuti.
In questi termini, al contrario, il meta refresh utilizzato a Zero secondi su una pagina completamente priva di contenuti viene considerato “al pari” di un redirect 301 (permanente) lato server. Questa tecnica viene chiamata “redirect dei poveri” ed è molto utile quando le pagine sono hostate su server Windows dove non è possibile fare un redirect 301 lato server tramite il file .htaccess.
Quindi, l’unico modo “sicuro” per utilizzare questo meta è realizzare una pagina che contenga solamente questo codice:

<head>
<meta http-equiv=”refresh” content=”0;url=http://seomarketingnews.wordpress.com/” />
</head>

Con questo, spero proprio di aver chiarito alcuni aspetti dei metatag ancora poco chiari, a volte proprio a causa di SEO con uno spiccato spirito umoristico. :)

A presto,
Michele

Google: come capire se un sito è bannato o penalizzato

Settembre 8, 2007

Fra i webmaster, si parla sempre più spesso di penalizzazioni e siti bannati dal motore di ricerca californiano. Facciamo un po’ di chiarezza.

Penalizzazioni e ban di Google

Leggendo svariati post e blog che parlano di SEO e Web marketing, non ho fatto a meno di notare che molti utenti e webmaster, non hanno ben chiara la differenza fra sito bannato e sito penalizzato. Inoltre da un po’ di tempo, un calo nelle Serp (risultati delle ricerche), viene immediatamente associato ad una penalizzazione: non è così e questo post spero delinei al meglio i due significati e come capire se il proprio sito è penalizzato o bannato.

Differenza fra penalizzazione e ban di un sito

PENALIZZAZIONE: il sito internet è presente almeno con una pagina all’interno degli indici di Google, ma viene “retrocesso” di posizioni all’interno delle SERP in cui prima appariva nei primi risultati (prime 2 pagine). In questi termini, vi sono varie forme di penalizzazione (-30 penality, -950 penality, etc.) e, solitamente, la maggior parte delle penalizzazioni sono scovate al 70% grazie agli algoritmi anti-spam e viene risolta (tolta) altrettanto frequentemente con modalità algoritmiche.
Solitamente le penalizzazioni avvengono quando si utilizzano tecniche spam (poco invasive e massicce) per falsare i risultati in SERP.

BAN: il sito viene completamente escluso dagli indici di Google (non è in alcun modo indicizzato, anche per ricerche contenenti il nome del dominio). Questa esclusione dagli indici avviene, più o meno, al 40% in modo algoritmico, ma più frequentemente è un’operazione manuale dovuta a segnalazioni che giungono ai quality rater che studiano i siti presenti fra i risultati di ricerca. Un sito può essere bannato per svariate motivazioni, elenco solo quelle più frequenti:

  • Utilizzo di tecniche SPAM avanzate (cloaking, doorways page, etc.)
  • Backlink ad un sito Bannato (se il sito linka un sito già bannato, è probabile il ban ricada anche sul sito contenente il link)
  • Creazione di un network SPAM
  • Ora che abbiamo definito meglio i significati di penalizzazione e ban, vediamo come scoprire se un sito è vittima di queste due operazioni anti-spam eseguite da Google.

    Come capire se un sito è penalizzato

    Personalmente, per valutare la penalizzazione di un sito, procedo in questo modo:

    1) effettuare una query (ricerca) in Google per il domionio (ad esclusione del “http://www.”) ad esempio per: “nomesito.it”. Se il sito non è presente nelle prime 5 posizioni, ci sono buone possibilità che il sito sia vittima di una penalizzazione;

    2) per avere maggiori certezze, ripetere la query anche per il dominio con il “www.” ad esempio per: “www.nomesito.it” e si traggono le stesse conclusioni del punto precedente;

    3) infine, per la prova del 9, basta ricercare anche il nome del dominio (sempre senza “http://www.”) più una parola chiave principale per la quale il sito è ottimizzato, ad esempio: “nomesito.it keyword principale”. Se il sito si presenta ancora in posizioni inferiori rispetto alle prime 5, la penalizzazione è “quasi” certa (quasi perchè om condizioni particolari, tipo di fluttuazioni sinusoidali delle serp di Google, può darsi che il sito internet non sia veramente penalizzato ma solo in una particolare fase di analisi da parte di Google).

    Come capire se un sito è Bannato

    Sempre in modo personale, io utilizzo queste semplici tecniche per valutare se un sito è stato bannato da Google:

    1) soluzione più semplice ed immediata: effettuare una ricerca col comando “site:” + il nome di dominio, ad esempio “site:www.nomesito.it”. Se non vi sono risultati trovati, allora la probabilità che il sito sia bannato è molto alta. Attenzione però, questo potrebbe anche solamente significare che il sito non è stato ancora indicizzato.

    2) iscrivendo il sito al Webmastertool di Google, nell’homepage relativo al sito internet (dopo la verifica) è possibile vedere alcune indicazioni da parte del crawler di Google che indica chiaramente la motivazione del perchè il sito non sia presente negli indici (ricorda che dal web master tool è possibile anche richiedere la reinclusione di un sito bannato).

    Spero davvero di aver fatto chiarezza a tutti i webmaster ed appassionati che controllano periodicamente le SERP ed i risultati dei propri siti internet in funzione del ranking raggiunto su Google.

    Articolo a cura di Michele De Capitani
    Prima Posizione Srl - Web Marketing

    Tecniche black-hat: il blog Spamming

    Luglio 31, 2007

    Cercando articoli riguardati lo Spamming, sono imbattuto in questa interessante ricerca (anche se un po’ datata) eseguita a dall’università del Maryland, che analizzando il pingserver di weblogs.com hanno verificato alcuni dati riguardati il Blog-Spamming.

    La blogsfera, come praticamente ogni strumento di popolarità in rete, subisce attacchi SPAM da siti e Spammer in cerca di Links (Splogs - Aka Spam blogs).

    Vediamo ora cos’è emerso dalla ricerca condotta dall’università di Baltimore County:

    - oltre il 50% dei ping inviati risultata essere spam, si tratta di documenti inutili generati da software (automatici o semi-automatici) che hanno come unico scopo quello di racimolare qualche link
    - oltre il 60% dei ping inglesi è spam, con una differza rispetto alla media modiale di un + 12%
    - Più del 55% dei blog che eseguono un ping sono blog di intrisi di spam
    - il servizio più utilizzato dai blogger è: Myspace, che è quello che incrementa maggiormente la crescita della blogosfera
    - Più della metà dei siti di Blogger (estensione blogspot di proprietà Google) sono blog spam.
    - La Mountain View (California) è in cima alla classifica delle città con maggior attività di splogs
    - Circa la totalità dei blog con estensioni .info (ben il 99.8%) sono Splogs.

    Ma perchè esiste questo fenomeno?

    La motivazione principale sono i ricavi derivanti dai sistemi di affiliazione in PPC (Pay per Click) offerti dai motori di ricerca (Google Adsense, Yahoo Search Engine Marketint, Etc.).

    Per tanto, la curiosità sta nel fatto che chi genera spam non è altro chi lo alimenta: Google paga gli inserzionisti Adsense e questi spammano le Serp di Google per guadagnare sempre di più. E il motore cosa fa? Cerca di eliminare lo spam dai propri indici per non rischiare di perdere utenti e quindi traffico (la risorsa principale per un motore di ricerca!).

    Soluzione

    Come eliminare lo spam? Semplice, basta eliminare i servizi di affiliazione in PPC… ma non credo proprio che Google e Co. decidano di perdere questa grossa fetta di mercato. :D

    A presto,
    Michele